Я так понимаю, vanstock анализирует статистику по ключевым словам, а не по картинкам. Поэтому понять, абстрактный это фон или белый фон с яблоком - невозможно.
Но могу чего-то не знать в его алгоритмах, поэтому подождём ответа ТС.
Согласен с Labrador: в большинстве картинок (по крайней мере у меня) есть ключевики либо бэкграунд, либо айкон. Это самые общие характеристики изображений. Все остальное - гораздо Уже и конкретней.
допустим, у нас есть 5 картинок, яблоко на фоне, человек на фоне, абстрактный фон, иконка, и рождественский фон, 4/5 содержат слово фон.
Если мы добавим еще 5 ТАКИХ же картинок, получим рост базы в 2 раза:
Рост тематики яблока - будет тоже в 2 раза, рост людей - тоже в раза, иконок и т.п.
Это говорит о том, что если убрать из всех описаний слово фон - мы просто сократим знаменатель. полагаю, само слово фон здесь является неким "спамом" и дает прирост вместе с базой. Раньше так писали в каждом видео HD 1080. Потом шаттер это запретил.
Всё верно, с одним уточнением: более быстрый рост по слову "фон" может говорить, например, о том, что в этот период произошёл бум спама по этому слову. Авторы поняли, что оно популярно и начали всё активнее добавлять его.
В этом случае картина будет как раз такая, как на графиках - даже без фактического прироста количества картинок с фонами.
Честно говоря, меня удивляет ваша дилемма. Поставьте категорию texture/background и задайте слово background - вуаля, исключительно фоны на выходе. То же в любых других случаях, всегда задавайте категории поиска.
Возможно, проблема в том, что в обсуждении нигде не участвовали категории. И нигде не было сказано, что vanstock их использовал для анализа, как фильтр.
Ещё раз повторю: если я правильно понимаю, то софт, который он использовал, анализирует ключевые слова.
А Вы говорите про то, как мы можем сейчас это сделать. Это понятно, но не подскажете, как мне сейчас сделать такой поиск по прошлым годам?
А Вы говорите про то, как мы можем сейчас это сделать. Это понятно, но не подскажете, как мне сейчас сделать такой поиск по прошлым годам?
api шаттера позволяет задать помимо прочего ещё и диапазон времени загрузки изображения. С помощью запросов через api можно провести анализ базы за любой промежуток времени, естественно, за вычетом бахнутых портфелей со спамом, но тут нам может придти на помощь статистика мранка по приросту базы. В крайнем случае забаненных можно вовсе не учитывать.
vanstock, тут немного о другом. Речь о том, что, снимая яблоко на белом фоне, девушку на фоне моря, рождественский стол или осенний пейзаж, которые можно использовать в качестве фона и т.д. и т.п. - все добавляют в ключи слово "background".
Поэтому изображения, содержащие слово "фон" - это далеко не только фоны.
Или я неправильно понимаю, что Вы называете "по запросам фоны". Это ведь картинки, в ключах которых прописано слово "фон", правильно?
Все верно, это просто картинки у которых в ключах есть слово background. Поэтому - да, это может быть не абстрактный скриптовый фон, это может быть набор сантаклаусов в пляжных костюмах с упряжкой дельфинов, на фоне лазурного неба. Будет слово - попадет в выборку. Таких случае много, они всякие разные, но в итоге только по запросу background растет гора, по всем прочим (кристмас, животные, дельфины, лето и т.д.) плоскогорья. Да, совокупность всех возможных видов background велика и там все подряд, но на местах, по тем запросам по которым люди действительно хотят видеть свои картинки в топах - там тишь да гладь (сравнительно). На третьем графике показана динамика доли фонов по годам - она практически стабильна. Люди равномерно впихивают в свои новые картинки этот ключ год от года, и его доля стабильна. А вот доли многих других уменьшаются, почему? Грузят вроде все больше и больше, а доли уменьшаются.
Вот Wisky хороший пример дал. Представьте только что было(загружено в первый год) 100 картинок и 60% из них с чем-то на фоне и с нужным ключом в мете, потом добавилось еще 200 каких-то картинок (мы их не видим), и выяснилось что картинок с ключевиком background по-прежнему 60%, при этом число фонов увеличилось в 3 раза (с 60 до 180). Доли картинок из известных популярных тематик (вроде яблоко, человек, собака, цветы и т.д.) уменьшились, либо тоже стоят на месте; хотя число некоторых (например цветочки) могло вырасти в 2 раза с 15 до 30, но доля то при этом упала с 15% до 10%(хотя это если считать относительно всех картинок. на графике указаны доли для каждого отдельного года, и тогда 15 новых картинок, из объема в 200 показали бы падение аж до 7,5%). Что это значит? Что за контент был загружен на сток? Как это повлияло на конкуренцию в старых добрых темах?
Искать по категории хорошая мысль. Тоже подумал было "жаль нет категории шлак", и сразу сообразил что есть, даже две. Года два назад делал полное исследование шаттеровских категорий, было ясно видно что все кроме этих самых двух (фоны/текстуры и абстракт) либо пусты совершенно, либо наполнены едва-едва. Сейчас думаю ситуация только усугубилась.