Роблю автоматичний опис публікованих зображень для тих, у кого вади зору. Непогано. Тепер зробити ще переклад опису мовою, котрою основне повідомлення написано.
Використав Cloudflare Workers AI - у них моделі опису зображень в беті та безкоштовні, як розумію. Цікаво, скільки буде коштувати у підсумку.
Щось модель llava-1.5-7b-hf не запрацювала, а uform-gen2-qwen-500m працює.