Додаток Google Lens навчився розпізнавати мільярд зображень

Компанія Google опублікувала у своєму блозі звіт про успіхи додатка Google Lens за минулий рік. На старті в його бібліотеці зберігалося 250 тисяч об'єктів, зараз їх сумарна кількість перевищує мільярд і, до всього іншого, програма обзавелася новими функціями, інформує UkrMedia.

Великий обсяг предметів надійшов завдяки сервісу Google Shopping, який призначений для пошуку різних товарів в інтернет-магазинах. Оскільки алгоритм Google Lens звіряється з тисячами зображень пошукача, визначення об'єкта по фото не займає багато часу. Цей метод дозволив додати значний об'єм даних, однак у нього є свої недоліки. Наприклад, він не враховує старі предмети, які не потрапляють в онлайн-магазини, – на кшталт ретроконсолей або касетних плеєрів. Тому і Google Lens не зможе їх впізнати.

Разом з тим фахівці компанії відзначають, що алгоритм досі не завжди працює коректно. Вони пояснюють це сукупністю факторів, серед яких – невідповідність фотографій користувачів картинкам, по яким тренується модель, кут огляду і якість знімків. За їх словами, вони вже працюють над рішенням, пропонуючи штучному інтелекту більше зображень, знятих на камери смартфона.

Ще в ранній версії Google Lens могло виводити інформацію про заклад (наприклад, про ресторани) по фотографії його вивіски. Зараз творці пішли далі і навчили додаток читати. Тепер воно здатне скопіювати виділений на фотографії текст. При цьому воно враховує різні шрифти та мову, завдяки зразками з бази даних Google Books, за якими навчалося. Для того щоб розрізняти схожі символи на зразок нуля і букви «о», алгоритм перевіряє орфографію в інтернеті.

Також у програми з'явився пошук по стилю, який дозволяє по зробленій фотографії знайти схожі предмети. Знову ж, програма буде шукати серед зразків з магазину, тому варто ретельно вибирати кут огляду. В Україні Google Lens доступен через програму «Google Фото».

Навесні корпорація Google анонсувала пару експериментів, які допоможуть штучному інтелекту краще розуміти семантичний зв'язок між словами. Незважаючи на серйозну задачу, самі програми оформлені у вигляді ігор, в яких відповіді учасників постійно вдосконалюють здібності алгоритму.

Джерело