Всем привет!
Как возможно кто-то по
соседней теме знает, я занимаюсь разработкой бесплатного сервиса визуального ключевания
ImStocker Keyworder. Во время своей работы он накапливает базу метаданных запрошенных работ, статистикой которых я хотел бы с вами поделиться. Возможно, кому-нибудь она будет полезна
На данный момент база содержит метаданные о свыше 33 миллионах работ, включая фото (67%), иллюстрации (3%), векторы (15%) и видео (15%). По стокам база распределяется следующим образом: 59.2% с Shutterstock'а, 22.4% c Dreamstime, 10.1% с CanStockPhoto и 8.3% c Adobe Stock (+ранее с Fotolia)
Будем рассматривать ключевые слова по 5 критериям:
1) Частота употребления в целом
2) Частота попадания ключевого слова в ТОП Shutterstock'а
3) Кол-во скачиваний работ, содержащих ключевое слово, на Dreamstime и CanStockPhoto
4) Среднее кол-во скачиваний
5) Прирост скачиваний за год
Чтобы не смешивать, изображения (фото, иллюстрации и вектор) будут анализироваться отдельно от видео. В каждом критерии буду приводить по 50 примеров лучших ключевых слов. Если кто захочет заняться своим исследованием, по ссылке:
https://imstocker.com/ru/blog/37-mos...-keywords-2019 - можно будет скачать CSV-файлы со списками по 500 примеров
1) Частота употребления в целом
Рассмотрим, сколько раз, какое слово встречается среди 33 миллионов проанализированых работ
PHP код:
ИЗОБРАЖЕНИЯ | ВИДЕО
|
Слово Процент от общего числа | Слово Процент от общего числа
------------------------------------ ----------------------------------
background 43.45 | background 30.79
white 27.88 | beautiful 27.48
nature 22.05 | nature 24.89
beautiful 20.53 | young 18.43
design 20.24 | woman 18.4
isolated 17.56 | summer 17.65
blue 16.19 | travel 17.36
illustration 15.98 | white 16.49
green 15.66 | female 16.2
vector 14.63 | people 16.19
summer 14.27 | blue 15.48
travel 14.15 | girl 15.45
people 13.39 | water 15.03
concept 13.34 | green 14.81
business 12.92 | caucasian 14.02
black 12.66 | landscape 13.78
food 12.23 | closeup 13.73
young 11.96 | man 13.7
closeup 11.69 | happy 13.36
color 11.64 | lifestyle 13.05
natural 11.63 | adult 12.97
woman 11.42 | outdoor 12.96
symbol 11.16 | sky 12.81
red 11 | city 12.49
beauty 10.92 | person 12.48
outdoor 10.67 | view 12.35
sky 10.63 | beauty 12.24
landscape 10.59 | business 11.85
art 10.53 | day 11.57
abstract 10.46 | food 11.23
female 10.14 | black 9.96
old 9.87 | motion 9.8
view 9.83 | natural 9.64
happy 9.78 | outdoors 9.61
water 9.62 | sea 9.36
girl 9.42 | light 9.36
person 9.37 | healthy 9.32
architecture 9.35 | hand 9.17
healthy 9.26 | tourism 9.12
fresh 9.15 | color 8.95
icon 8.88 | aerial 8.89
decoration 8.75 | technology 8.55
man 8.74 | fun 8.53
city 8.7 | male 8.51
modern 8.49 | fresh 8.23
colorful 8.48 | holiday 8.1
sign 8.4 | vacation 7.86
building 8.36 | concept 7.85
tourism 8.1 | park 7.72
holiday 7.97 | building 7.7
Данный критерий показывает популярность ключевых слов у авторов работ и в приницпе на его основе можно судить, какого плана работы и какой тематики выкладываются на стоки чаще всего, т.е. оценить конкурентность. Рассмотрим следующие критерии, чтобы оценить спрос покупателей
2) Частота попадания ключевого слова в ТОП Shutterstock'а
Суть метода в том, что рассматриваются метаданные всех работ, попадающих под пустой поисковый запрос на Shutterstock. По умолчанию, если не учитывать примешивания, первыми будут выходить наиболее коммерчески успешные файлы.
Чтобы устранить влияние сезонности, будет подсчитываться сколько раз ключевое слово попадало в топ на протяжении чуть меньше года. Результаты:
PHP код:
ИЗОБРАЖЕНИЯ | ВИДЕО
|
Слово Процент от общего числа | Слово Процент от общего числа
------------------------------------ ------------------------------------
background 63.86 | background 29.12
design 53.34 | people 22.2
illustration 52.85 | young 22.01
vector 50.11 | beautiful 21.09
white 31.17 | woman 20.46
isolated 29.13 | man 18.45
concept 28.47 | nature 18.42
graphic 28.04 | travel 18.14
abstract 27.02 | technology 17.97
business 24.45 | business 17.7
symbol 23.27 | happy 17.62
modern 22.59 | person 17.15
art 21.23 | female 17
icon 20.57 | lifestyle 16.85
decoration 19.48 | white 16.66
people 19.19 | city 15.59
banner 19.07 | motion 15.38
template 18.91 | modern 14.75
sign 18.26 | summer 14.02
set 17.91 | blue 13.77
happy 17.83 | light 13.69
element 17.79 | girl 13.55
pattern 17.55 | 4k 13.43
nature 17.24 | caucasian 13.15
black 16.03 | sky 12.73
texture 15.92 | male 12.65
flat 15.64 | adult 12.56
style 15.55 | black 12.08
beautiful 15.39 | abstract 11.85
holiday 14.86 | view 11.57
woman 14.76 | water 11.08
technology 14.47 | fun 11.08
card 14.41 | urban 10.69
blue 13.79 | green 10.6
vintage 13.57 | design 10.41
wallpaper 13.25 | closeup 10.29
color 13.19 | landscape 10.11
summer 13.15 | aerial 10.01
poster 13.12 | outdoors 9.9
light 12.84 | concept 9.87
celebration 12.73 | slow motion 9.8
web 12.46 | night 9.15
young 12.41 | outdoor 9.15
man 12.37 | day 9.06
fashion 12.04 | tourism 9.02
person 11.87 | home 8.84
creative 11.79 | portrait 8.67
girl 11.77 | computer 8.36
colorful 11.73 | architecture 8.29
line 11.63 | hand 8.27
Основные тематики изображений: бизнес, люди, технологии, праздники и др.
Основные востребованные виды изображений: background, icon, banner, template, pattern, texture и др.
Тематики видео: люди, природа, путешествия, технологии, бизнес, образ жизни и др.
3) Кол-во скачиваний работ, содержащих ключевое слово, на Dreamstime и CanStockPhoto
Напрямую узнать о кол-во продаж тех или иных работ Shuttetstock'а нельзя, но можно провести аналогию с тем, как продаются работы с теми или иными ключевиками, на других стоках (с некоторой долей скептиса или понимания
)
Итак, просуммировав число продаж, топ ключевиков получается следующим:
PHP код:
ИЗОБРАЖЕНИЯ | ВИДЕО
|
Слово Число скачиваний | Слово Число скачиваний
----------------------------- ------------------------------
background 6965043 | background 17091
white 4732391 | beautiful 10719
blue 3397387 | blue 10188
isolated 3257843 | business 9580
beautiful 3213250 | adult 8051
design 3078714 | caucasian 7781
business 2868242 | woman 7578
illustration 2684132 | black 7446
black 2589688 | female 7310
concept 2532123 | abstract 7295
people 2409146 | people 6931
abstract 2293704 | nature 6816
nature 2221650 | motion 6587
female 2207197 | white 6493
green 2180587 | man 6177
art 2169657 | beauty 5866
woman 2167178 | concept 5836
color 2165025 | light 5813
vector 2144408 | happy 5800
young 2072449 | young 5709
beauty 2032463 | color 5650
caucasian 1906999 | girl 5398
girl 1857895 | bright 4935
happy 1851459 | sky 4931
adult 1795374 | green 4918
red 1772581 | day 4841
man 1669941 | closeup 4832
closeup 1669157 | city 4831
person 1661249 | computer 4646
food 1613988 | 1080p 4440
colorful 1474399 | design 4406
healthy 1376877 | dark 4249
sky 1375853 | hd 4133
cute 1369955 | technology 4121
health 1368953 | communication 4080
old 1363498 | night 3979
architecture 1314492 | water 3934
hand 1301014 | video 3757
symbol 1272853 | attractive 3716
building 1254390 | red 3609
decoration 1253625 | male 3547
summer 1248277 | fun 3523
bright 1242799 | person 3465
animal 1213270 | 3d 3397
male 1208625 | cheerful 3386
close 1206625 | summer 3379
light 1203810 | celebration 3370
child 1190620 | travel 3223
care 1157035 | digital 3206
fun 1154848 | hand 3193
На самом деле, получается довольно высокая корреляция между этим и предыдущим списками. Если посчитать, сколько из топ-500 ключевиков попало в списки по обоим критериям, то получится 70% для изображений и 81% для видео (полные списки можно скачать
здесь).
Таким образом, этот и предыдущий критерии отражают спрос покупателей на работы с теми или иными ключевыми словами. Однако, они не учитывают конкурентности
4) Среднее кол-во скачиваний
Самый простой способ учесть конкурентность - разделить число скачиваний на количство работ, получив среднее число загрузок на слово. При этом нужно учесть, что редкоупотребляемые слова, которые были добавлены в популярные работы, могут получить неоправданно высокий рейтинг. Чтобы минимизировать эту вероятность, будут учитываться только ключевые слова, которые появляются в работах хотя бы 15000 раз для изображений и 5000 раз для видео (т.к. общее число видео меньше)
Результат:
PHP код:
ИЗОБРАЖЕНИЯ | ВИДЕО
|
Слово Скачиваний на слово | Слово Скачиваний на слово
---------------------------------- ---------------------------------
boys 5.99 | 3d 0.38
diversity 5.81 | 1080 0.36
swirl 5.67 | hd 0.33
clipart 5.63 | definition 0.3
students 5.54 | 1080p 0.3
loving 5.41 | science 0.28
colours 5.29 | 1920x1080 0.28
graphics 5.18 | success 0.27
words 5.15 | loop 0.27
teamwork 5.1 | backgrounds 0.26
nurse 5.04 | medical 0.24
unity 5.02 | cloudscape 0.23
clip 5.02 | seamless 0.23
certificate 4.99 | space 0.23
stars 4.9 | glowing 0.23
communications 4.88 | illustration 0.23
team 4.86 | earth 0.23
communicate 4.85 | 20s 0.22
mind 4.81 | medicine 0.22
jesus 4.81 | network 0.21
audience 4.78 | healthcare 0.21
bible 4.72 | information 0.21
anatomy 4.69 | america 0.2
curl 4.66 | fantasy 0.2
adults 4.66 | 30s 0.2
colour 4.66 | data 0.2
staff 4.64 | biology 0.2
meeting 4.64 | shiny 0.19
hope 4.63 | illuminated 0.19
partnership 4.63 | glow 0.19
discussion 4.62 | human 0.19
teaching 4.62 | lights 0.19
cooperation 4.59 | lapse 0.18
massage 4.59 | finance 0.18
legal 4.58 | dancing 0.18
magical 4.57 | corporate 0.18
businesspeople 4.56 | office 0.17
symbols 4.54 | time 0.17
girls 4.54 | speed 0.17
laugh 4.53 | alpha 0.17
metaphor 4.5 | event 0.17
retirement 4.5 | text 0.17
organization 4.49 | graphic 0.17
luxurious 4.49 | clip 0.17
sales 4.49 | flare 0.17
spirit 4.48 | businesswoman 0.17
conference 4.46 | animation 0.16
networking 4.4 | falling 0.16
teacher 4.4 | silhouette 0.16
planning 4.4 | african 0.16
Можно выделить основные тематики изображений: люди и их взаимоотношения, работа в команде, бизнес, медицина, религия и др.
Тематики видео: наука, медицина, природа, люди, бизнес и др.
5) Прирост скачиваний за год
Предыдущие метрики плохо отражают динамику изменения спроса. Поэтому рассмотрим еще одну - прирост числа скачиваний за год. Будем брать не абсолютный прирост, а относительный, чтобы уменьшить влияние слишком распространенных слов (рост которых будет высоким, хотя бы просто из-за большого числа новых файлов).
PHP код:
ИЗОБРАЖЕНИЯ | ВИДЕО
|
Слово Прирост в % | Слово Прирост в %
------------------------------- ----------------------------
flat lay 0.2367 | wheat 0.0691
blockchain 0.1716 | cheese 0.0638
stock photo 0.1588 | aquatic 0.0606
flatlay 0.137 | top view 0.0588
unicorn 0.1248 | grill 0.0581
3d rendering 0.1225 | homemade 0.058
top view 0.1203 | tasty 0.0508
summer vacation 0.1138 | drone 0.0504
cryptocurrency 0.1132 | fish 0.0498
lay 0.1111 | foliage 0.048
business concept 0.1061 | branch 0.0461
crypto 0.1043 | animation 0.0457
bitcoin 0.1031 | workout 0.0455
natural background 0.0996 | back 0.0445
for 0.0915 | aqua 0.0443
nature background 0.091 | bay 0.0441
pink background 0.0899 | lunch 0.044
yellow background 0.0886 | cup 0.0438
wood background 0.0884 | mountain 0.0434
marijuana 0.0858 | foam 0.043
pattern background 0.0856 | underwater 0.0425
hologram 0.0828 | ingredient 0.0425
freelancer 0.0827 | arms 0.0422
greeting card 0.0825 | cooked 0.0419
social media 0.0817 | gourmet 0.0418
happy new year 0.081 | beverage 0.0413
drone 0.0802 | china 0.0412
wooden background 0.077 | deep 0.0412
mockup 0.0753 | vegetarian 0.0409
wooden table 0.0743 | exotic 0.0408
healthy food 0.073 | cafe 0.0408
dark background 0.0724 | golden 0.0407
polygon 0.0705 | training 0.0404
texture background 0.0705 | flat 0.0403
hemp 0.0699 | aerial 0.0397
2018 0.0672 | meat 0.0396
blue background 0.0661 | dawn 0.0395
abstract background 0.0647 | black background 0.0395
gray background 0.064 | futuristic 0.039
your 0.0623 | seascape 0.0389
automation 0.0622 | aerial view 0.0387
web site 0.062 | slow 0.0386
background texture 0.0606 | bottle 0.0385
peony 0.0601 | drink 0.0385
cyber 0.0599 | kitchen 0.0385
new year 0.0598 | bubble 0.0384
startup 0.0585 | italy 0.0383
freelance 0.0565 | wooden 0.038
confetti 0.0556 | cuisine 0.0379
instagram 0.0554 | blowing 0.0377
Надеюсь, что эта информация кому-нибудь будет полезна
Например, при подготовке к новым съемкам, при поиске интересных ниш или для атрибутирования своих файлов (это делать довольно просто, используя бесплатную ключевалку
ImStocker Keyworder ). По
ссылке, как я писал, можно скачать CSV-файлы по каждому критерию с 500 примерами лучших ключевых слов, а так же увидеть их в виде диаграмм.
И несколько вопросов напоследок:
1) Учитываете ли вы популярность ключевых слов при атрибутировании? Какие метрики для оценки при этом используете?
2) Отслеживаете ли вы тренды? Какими способами или инсрументами вы пользуетесь?