Google го прави зумирањето и подобрувањето на фотографиите реалност

Веројатно сте виделе фантастични филмови или ТВ емисии каде главниот лик бара да ја зголеми сликата и да го подобри резултатот - да покаже лице, или регистарска табличка или кој било друг клучен детал. Најновите системи за вештачка интелигенција (ВИ) на Google, базирани на т.н модели на дифузија, се способни да го изведат овој трик.

Тоа е незгоден процес за совладување бидејќи во суштина додава детали на сликата што камерата првично не ја снимила, користејќи суперпаметни претпоставки засновани на други слични слики.

Google

Во Google, оваа техника се нарекува природна синтеза на слики, а во ова конкретно сценарио, ултра висока резолуција на сликата. Започнувате со мала, пикселирана фотографија и завршувате со нешто остро, јасно и природно. Можеби не е баш оригиналот, но е доволно блиску за да изгледа реално за човечкото око.

Google претстави две нови алатки за вештачка интелигенција за оваа работа. Првиот се нарекува SR3, или Супер-резолуција преку повторено префинетост, и работи со додавање шум на сликата и потоа отстранување. Преку низа веројатносни пресметки засновани на голема база на податоци со слики и некоја магија за машинско учење, SR3 може да замисли како изгледа верзијата со супер висока резолуција на слика со пиксели со ниска резолуција.

Втората алатка е CDM, или каскадни модели на дифузија. Google ги опишува овие како „цевководи“ по кои моделите на дифузија - вклучувајќи го и SR3 - може да се насочат за висококвалитетно зголемување на резолуцијата на сликата. Потребни се модели за подобрување и ги претвора во поголеми слики.

Google

Со користење на различни модели за подобрување со различна резолуција, пристапот CDM може да ги надмине алтернативните методи за зголемување на резолуцијата на сликата, според Google. Новиот мотор со вештачка интелигенција беше тестиран на ImageNet, џиновска база на податоци со слики за обука која вообичаено се користи за истражување во визуелното препознавање на објекти.

Крајните резултати од SR3 и CDM се импресивни. Во стандарден тест со 50 човечки доброволци, сликите на човечките лица генерирани од SR3 беа помешани со вистински фотографии околу 50% од времето - и имајќи предвид дека идеалниот алгоритам треба да достигне 50%, тоа е импресивно. Вреди да се повтори дека овие подобрени слики не се точни совпаѓања со оригиналите, тие се внимателно пресметани симулации врз основа на математиката на веројатноста.

Google

Google ветува многу повеќе од своите нови мотори со вештачка интелигенција и поврзаните технологии - не само во смисла на зголемување на сликите на лицата и другите природни објекти, туку и во други области на веројатностичко моделирање.

Прочитајте исто така:

Jereloнаучен силерт

Пријавете се

0 коментари

Вградени критики

Прикажи ги сите коментари

Други статии

Како во филмовите: новата вештачка интелигенција на Google за обработка на фотографии го прави нивното скалирање и подобрување

Неодамнешни коментари