Сейчас вижу проблему только в изображении людей, делающих что-то конкретное. Например, землекоп роет канал или остановился вытереть пот. У ИИ это будет просто человек с лопатой. Остальные косяки с лишними пальцами давно в прошлом. Если сейчас такое грузят, то это либо заготовленные запасы, либо автору просто наплевать и он не сделал пару движений для исправления/избежания этого.
С фудом есть определенные тонкости, но их надо искать. Например, очищеный банан или разрезанный повдоль изобразить невозможно

Или участие людей, делающих определенные вещи, типа лепки пельменей. Мне кажется, до этого ИИ действительно далековато. У него сейчас просто другой вектор развития, да и недостаточно материалов для обучения.