Какого объема? 350 миллионов записей даже по килобайту каждая - это 350 гигов всего. Распределенность тут вааще не нужна.
Проблема надежности хранения данных - это вообще совершенно параллельная задача. Есть тонны способов ее решения, они могут быть какими угодно
Обычно в определенные интервалы времени забираются данные, у которых дата последнего изменения старше даты последнего "забора". И они обновляются в поисковом индексе.
Однако сортировка в этом индексе на шаттерстоке ведется не просто по ключевым словам и описанию, а в основном по рейтингу картинки. А рейтинг либо ставится фиктивный - это те самые добавки новья по 4-6 картинок на каждые 100 поисковой страницы сайта, либо берется родной, который повышается продажами картинки, причем чем раньше она продалась с момента загрузки, тем круче. Вообще для хорошего рейтинга картинка должна хорошо продаться в первую неделю-две. Если такого не случилось, то в топе ей не висеть уже никогда, так как повышения рейтинга после двухнедельного срока там ничтожные.
Так что если картинка начала внезапно продаваться хорошо у разных людей - то это практически всегда означает, что настала ее очередь повисеть в топе по какому-то ключевику с фиктивным рейтингом. День-два она там повисит, и все, привет вечное забвение.