Root NationВестиИТ вестиApple го претстави својот нов модел со вештачка интелигенција ReALM

Apple го претстави својот нов модел со вештачка интелигенција ReALM

-

Истражувачите Apple развија систем за вештачка интелигенција наречен ReALM (Референтна резолуција како јазично моделирање), чија цел е радикално да го подобри начинот на кој гласовните асистенти ги разбираат и реагираат на командите.

Во истражувачки труд Apple опишува нова рамка за тоа како големите јазични модели го решаваат проблемот со референтната резолуција, која вклучува дешифрирање на двосмислени референци на објектите на екранот, како и разбирање на разговорниот контекст и контекстот во позадина. Како резултат на тоа, ReALM може да доведе до поинтуитивна и поприродна интеракција со уредите.

Apple

Препознавањето на референци е важен дел од разбирањето на природниот јазик, овозможувајќи им на корисниците да користат заменки и други индиректни референци во разговорот без конфузија. За дигиталните асистенти, оваа способност историски претставуваше значаен предизвик, ограничен од потребата да се толкува широк опсег на вербални сигнали и визуелни информации. Системот ReALM од Apple има за цел да го реши овој проблем со претворање на сложениот процес на препознавање на референци во чиста задача за моделирање на јазикот. На овој начин, таа може да ги разбере референците на визуелните елементи прикажани на екранот и да го интегрира ова разбирање во разговорниот тек.

ReALM ја реконструира визуелната структура на екранот користејќи репрезентации на текст. Ова вклучува парсирање на објекти на екранот и нивно распоредување за да се создаде текстуален формат што ја одразува содржината и структурата на екранот. Истражувачите Apple откри дека оваа стратегија, комбинирана со специјално подесување на јазичните модели за проблеми со резолуцијата, значително ги надминува традиционалните методи, вклучително и GPT-4 способностите на OpenAI.

Apple

ReALM може да им овозможи на корисниците многу поефективна интеракција со дигиталните асистенти врз основа на она што моментално се прикажува на екранот, без потреба од прецизни, детални инструкции. Ова би можело да ги направи гласовните асистенти многу покорисни во различни ситуации, како на пример помагање на возачите при навигација на инфозабавните системи додека возат или помагање на корисниците со попреченост преку обезбедување полесни и попрецизни средства за индиректна интеракција.

Apple веќе има објавено неколку истражувачки трудови од областа на вештачката интелигенција. Минатиот месец, компанијата откри нов метод за учење големи јазични модели што беспрекорно ги интегрира текстуалните и визуелните информации. Се очекува дека Apple ќе воведе голем број функции за вештачка интелигенција на конференцијата WWDC во јуни.

Прочитајте исто така:

JereloMacrumors
Пријавете се
Известете за
гостин

0 коментари
Вградени критики
Прикажи ги сите коментари
Претплатете се за ажурирања