Нека разберем как A.I. дефинират се проблемни пространства.

Разказът на околната среда

Представете си за момент, че карате за Uber в Ню Йорк.

16:00 часа е и е денят преди Деня на благодарността. Паркирал си до Уолстрийт и чакаш да пристигне следващият ти пътник. Гледате пътищата, докато се задръстват - пешеходци, коли, автобуси и всичко останало - докато всеки се втурва да стигне, където трябва, възможно най-бързо.

Вие сами искате да победите трафика, преди да е станало твърде късно, но има време за това последно пътуване.

Съвсем скоро някой чука на вратата на колата ви и вие се уверявате, че тя изглежда достатъчно близо до профилната си снимка в приложението. Пише, че е тръгнала към летището. Ти я пусна вътре.

„Здрасти!“ обръщаш се с усмивка. „Вътрешен терминал на летище Нюарк, нали?“

Тя приема поздрава, достатъчно приятелски, но изглежда малко притеснена.

По някаква причина имате лошо предчувствие за това. „В колко часа е вашият полет?“ — питаш предпазливо.

„След час е…“

Всяка цел има ограничения

Всички сме били в ситуация, в която краен срок бързо наближаваше и трябваше да избираме между лошото и по-малко лошото. Или с други, по-технически думи, трябваше да увеличим максимално нашата полезност в рамките на дадени ограничения.

В горния сценарий основната цел е да стигнете до летището и да спечелите стойностна печалба.

Има обаче няколко ограничения. Нека разгледаме време, най-очевидното. Най-просто казано, тъй като полетът на пътника е след час, за нас ще е най-добре да пристигнем преди това.

Как можем да решим този проблем? Може би бихме могли да караме бързо, за да спестим време, като използваме лентата за преминаване, когато е възможно. Но това може да е опасно и планираме да останем в рамките на ограниченията на скоростта. Може би можем да намерим по-кратък маршрут с GPS. Но дори и с Google Maps и Waze, по-краткият път не винаги е най-бързият; следователно имаме степени на несигурност.

И така, къде да начертаем границата между максимизирането на печалбата (да речем, която зависи от дължината и времето на пътуването), като същевременно оптимизираме потребителското щастие (за да можем да се придържаме към оценка от пет звезди)?

Определяне на проблемното пространство

Може да изглежда, че прекалено усложняваме проблема, но ние като хора се сблъскваме с решения като това всеки ден. Често най-добрата отправна точка е да се дефинира проблемното пространство и да се раздели на лесни подпроблеми.

По същия начин, проектирането на подходящ изкуствен интелект трябва да вземе предвид параметрите, които могат да повлияят на пътуването му от първоначалното състояние до целевото състояние. Ние наричаме този процес задача.

Задачата от своя страна има определени спецификации и свойства. Стюарт Ръсел и Питър Норвиг, в своята основна книга за изкуствения интелект, наричат ​​това PEAS(Pperformance, Environment, Адвигатели,Сензори) описание.

Изпълнението оценява колко добре сме постигнали дадената цел. В историята по-горе искаме да завършим пътуването, да пристигнем навреме, да шофираме законно, да останем в безопасност, да спечелим и да постигнем добър рейтинг. Всички тези елементи измерват колко добре сме свършили работата си, карайки от Уолстрийт до Нюарк.

Въвеждането на околната среда е основната тежест на останалата част от тази статия, но по същество то категоризира естествотона външно явление, което може да повлияе на нашия процес до целта. Например, докато шофираме към летището, трябва да сме загрижени за други превозни средства по пътя, пешеходци на пешеходни пътеки, различни пътища и пътни сигнали и т.н. Не сме сами в света и това, което правят другите, може да ни засегне, и това, което правим, може да им повлияе.

Задвижващите механизми са средствата, чрез които въздействаме на околната среда. Например, колата има клаксон, за да предупреждава другите, мигачи, за да информира за завой, волан, за да завърти действително, и педали за контрол на скоростта.

А сензорите са средството, чрез което вземаме сигнали от околната среда. Това може да е сензор за близост, който звучи, когато сме твърде близо до друго превозно средство или обект, сензор за напускане на лентата, който ни предпазва от дрифт, и нашия навигационен дисплей, който ни позволява да преглеждаме общи данни за превозното средство (като температура на маслото, предстояща поддръжка, коя радиостанция ние сме и т.н.).

Така че защо околната среда е най-голямата категория? Е, що се отнася до външното състояние на света, има много неща, които могат да се случат и много трябва да планираме.

Нека да разгледаме шестте скали, по които да видим природата на околната среда:

Напълно видими спрямо частично видими

Колко видима е една среда е свързано с това колко уместнаинформация можем да извлечем от нея в даден момент. Например, докато шофираме в града, можем да видим колите пред нас, зад нас и от двете страни (разбира се минус слепите зони). Може също да сме в състояние да преценим колко бързо шофират другите и дали възнамеряват да сменят лентите или не, използвайки съответно техните относителни скорости и индикации на мигачите. Вероятно обаче не можем да видим какво се случва две мили напред и няколко пресечки вдясно.

Но вероятно не е нужно да знаем тази информация, тъй като тя не се отнася до нашата непосредствена среда. Въпреки това, ако наистина шофираме две мили напред и няколко пресечки вдясно, може да се интересуваме от актуализации за задръствания, затворени пътища и т.н., идващи по пътя ни.

Ако разполагаме с цялата информация, която трябва да знаем, нашата среда е напълно видима. Този тип среда е от полза за изкуствения интелект, тъй като не е необходимо да следи никакви външни променливи; той просто приема външни знаци за рефлексивна обработка. От друга страна, достъпът до част, но не до цялата релевантна информация във всеки един момент създава частично видима среда. В този случай може да се наложи изкуственият интелект да следи историята, за да предвиди бъдещи решения.

Единичен агент срещу мулти-агент

Агенте всеки автономен обект (човек, компютърна програма, робот, животно, самоуправляваща се кола и т.н.), който може да възприема своята среда (чрез сензори) и да произвежда реакция (чрез изпълнителни механизми). Не е необходимо този отговор да е правилен или рационален;това е мястото, където се намесват показателите за ефективност. Но тези отговори в крайна сметка са артикулирани за постигане на цел.

Единичен агент може да се разглежда като изолиран. Например, ако играете пасианс, няма втори играч, срещу когото да се състезавате, докато ако седнете на покер маса, другите вече участват в резултата от играта.

По-специално покерът е напълно конкурентнасреда с много агенти. Всеки човек на масата се стреми да максимизира собствената си полезност или да „спечели“ за сметка на другите.

Ами шофирането? Пътищата също ли са конкурентна среда?

До известна степен, да, но не напълно; има договор (вашата шофьорска книжка), който ви казва, че избягването на сблъсъци, спазването на правилата за движение, използването на мигачи и шофирането в рамките на ограниченията на скоростта помагат за безопасността на всички на пътя, включително и на вас. Нарушаването на тези правила служи за конкурентоспособност и може да увеличи временната полезност (напр. рязане пред изхода, за да спестите малко време), но с риск от „получаване на билет“ или някаква форма на наказание. Следователно пътищата са частично конкурентни, но също така частично кооперативни.

Сега нека помислим за шофирането в общия смисъл: може ли самоуправляващият се агент да се разглежда като среда с единичен агент вместо мултиагентна?

Да, възможно е. Ако на перфектен път приемем договора, че хората са склонни да карат безопасно, тогава всички останали превозни средства могат просто да се разглеждат като обекти, които трябва да избягваме. Това е все едно да кажем, че нашата кола е единствената на пътя и че трябва да преминем през движещи се препятствия, за да стигнем до нашата дестинация.

В напълно кооперативна мултиагентна среда това е справедливо предположение и вместо това можем да го третираме като единичен агент. Но въведете конкурентоспособност и тя не успява да се задържи.

Детерминистичен срещу стохастичен

Нещо, което е определено, е гарантирано да се случи. Законите на физиката илюстрират това: при равни други условия, ако изпуснете ябълка, тя ще падне към центъра на масата на Земята. Това е просто гравитацията в действие.

В случай на AI шахматен агент, можем да си го представим в първоначалното състояние без все още направени ходове. Ако нашият агент има първия ход и реши да бутне пешка напред, гарантираное, че в следващото състояние тази пешка не е в началната си позиция.

От друга страна, ако агентът реши да премести пешката напред и ако понякога тя се окаже едно поле напред, понякога две полета напред, а понякога дори точно там, където е започнала, тогава имаме известна степен на несигурност какво ще се случи. Тази произволност се бори със стохастична или недетерминирана среда.

Епизодично срещу последователно

Класифицирането на среда като епизодична или последователна е свързано с хронологията на действията и дългосрочните полезности.

Например, с шах агент, всяко ново действие зависи от случилото се преди това. Или, с други думи, различните действия могат да имат различни последствия. Използването на вашата дама, за да вземете коня на опонента си, може да донесе краткосрочна полза, но също така може да изложи вашата дама на риск при следващия ход. Това е последователна среда.

Епизодичната среда, от друга страна, е тази, в която всяко състояние е независимо едно от друго. Ако полицай с радар сканира еднолентовия път за бързи шофьори, скоростта на предишната кола, при равни други условия, няма отношение към скоростта на следващата. Сякаш всяка кола, която минава пред полицая, е отделно, атомно състояние.

Разликата между епизодичните и последователните среди е „условна вероятност“, където вероятността за отделни събития зависи едно от друго, дадена част от информацията или не.

Статични срещу динамични

Статичната среда е тази, която не се променя, когато агентът вземе решение. Например в шах опонентът ви не може да направи ход, докато все още е ваш ред. Сякаш изминаването на времето е без значение: ход, направен за пет секунди, не е непременно по-добър от този, направен за пет минути (ако приемем, че играем шах без часовник, разбира се).

Динамичната среда, от друга страна, се променя, докато агентът обмисля. Докато шофираме, всички други коли около нас също се движат; някои сменят лентата, други ускоряват, други намаляват и т.н. Всяко решение, което вземаме на пътя, може да бъде повлияно от внезапното движение на други превозни средства.

Обърнете внимание на сходството на динамичната среда с мултиагентната среда. Ключовата разлика е, че в среда с множество агенти има опоненти, които се стремят да намалят нашата полезност, но в динамична среда се променят самите условия, а не полезността. Но със сигурност има известно припокриване между всяка скала.

Дискретно срещу непрекъснато

Нещо дискретно може да бъде разделено само на отделни, цели единици. Например, ако хвърлите монета, получавате или глави, или опашки. Няма нищо между тях (напр. не можете да хвърлите справедлива монета под ъгъл от 45 градуса). От друга страна, нещо непрекъснато може да бъде измерено: температурата може да бъде 100 градуса или по-точно 100,01 градуса или дори по-точно 100,012 градуса. Можем да разделим нещо непрекъснато на безкрайно малки части.

В резултат на това дискретна среда е такава с ограничен брой състояния. В шаха има толкова много начини, по които можем да подредим дъската. В резултат на това има толкова много действия, които можем да предприемем, за да достигнем тези състояния.

От друга страна, в непрекъсната среда, нашите случайни променливи могат да приемат всяка стойност в рамките на техните определени (или безкрайни) диапазони, и то плавно (до безкрайно малки деления). Докато шофираме, не можем мигновено да ускорим от нула до шестдесет; изисква известно време. Плавното движение при промяна на скоростта е непрекъснат характер на средата на шофиране. Освен това непрекъснатата среда се поддава на базирано на физика моделиране. Ето как самоуправляващите се автомобили предсказват сблъсъци с други превозни средства на пътя.

Тези шест скали са качествено описание за класифициране на среда и въпреки че има припокриване между тях, те предоставят добър поглед към проектирането на „интелигентни агенти“, следващото основно съображение на проблемното пространство на ИИ.

Когато правите това, може да е важно да разгледате седма скала:

Известни срещу неизвестни

Най-„мистериозният“ от всички типове, известен срещу неизвестен, описва колко добре дизайнерътна интелигентния агент познава околната среда.

Без да навлизаме твърде далеч в психологията, когнитивната наука и философията, нека разгледаме човешкото бебе. То се ражда на този свят с „определени рефлекси“, но не знае как да кара кола, как да играе шах, какви са законите, какво е човешкото общество! То научава тези правила и информация чрез опит и чрез взаимодействие с другите. Това е фундаментът на непозната среда.

По същия начин, със самоуправляваща се кола, ние като програмисти, инженери, дизайнери, не можем да я тестваме с всеки един път, който съществува в света. Изкуственият интелект, с който даряваме автомобила, трябва да бъде достатъчно самодостатъчен, за да използва някои основни, вкоренени знания като основа за бъдещи прозрения. След това тези прозрения се поддават на нови правила и нови разбирания. По-специално, може да тестваме нашия самоуправляващ се автомобил в Ню Йорк, но ако сме го разработили за американските пътища, той трябва да може да се движи навсякъдев страната без проблем.

„Дълбокото обучение“ често е механизмът, който използваме, за да разберем непознати среди, и е същността на текущите изследвания в областта на изкуствения интелект.

Но използвайки това въвеждащо разбиране за среди, сега трябва да можете да класифицирате общите проблеми в пространство, което ви казва кои елементи да имате предвид, когато търсите решение. Следващият етап от решаването на проблеми е „проектирането на правилния агент“. Приятно учене!

Преразглеждане на разказа

По дяволите, мислите си. Сега съм стресиран толкова, колкото и тя. Защо хората не могат да планират съответно пътуванията си?

Но не можете да й кажете това. „Добре, един час звучи добре“, лъжете категорично.

Бързо превключвате към приложението Google Maps, за да начертаете най-добрия маршрут. Пътеката е предимно червена и оранжева, никога не е добър знак, но ще трябва да се направи. Излизаш на улицата.

Движението се движи сравнително гладко, но след няколко минути пътникът ви прочиства гърлото си и пита: „Доста бавен ден, а? Мислите ли, че трафикът в близост до летището е също толкова лош?“

„Е, картата изглежда малко оранжева там, така че предполагам, че е така… но е малко далече, за да знаем със сигурност. Виждате ли, ние сме в частично видима среда и въпреки че GPS ни дава голяма картина, в непосредствения момент решенията ни се основават основно на това, което се случва около нас. Да поясня, че всеки тук се стреми бързо да стигне някъде. Някои до домовете си, някои на летища като нас, трети другаде на картата. Но всеки по този конкретен път има достъп само до едни и същи пътеки в близост. Следователно минимизирането на изразходваното време въвежда частично усещане за конкуренция в тази мултиагентна, частично видима среда.“

"А, добре…"

Скоро се качвате на магистралата и трафикът започва да се освобождава. Вашият пътник трябвада пристигне навреме. Отбивате в лявата лента и използвате непрекъснатия газ на автомобила, за да ускорите пътуването до целта.

Пътникът забелязва, че скоростомерът тиктака, и споменава: „Не е нужно да стигам до летището толковабързо.“

Да, имаш, мислиш си, ...но тя има право. Намалявате и се връщате в дясната лента. Във всеки случай шофирането на колата твърде бързо въвежда възможността горивната помпа да не може да се справи. При по-стар автомобил като този не искате да правите педала на газта стохастична променлива на състоянието. Освен това не би било добре да вземете билет; в тази среда обичайна последователност, която следва превишаване на скоростта, е спиране...

Стигате до Нюарк навреме, изненадващо, и стигате до зоната за заминаване. Докато решавате на кое място да оставите пътника, друга кола заобикаля отпред, за да заеме първото празно място.

„Уау, някой бърза!“ — възкликва пътникът. „Но можете да ме оставите точно тук; много ви благодаря за пътуването.“

"Вие сте добре дошли." Паркирате колата и отключвате вратите.

Тя излиза с багажа си, но се обръща, за да се сбогува. „Предполагам, че не можете да обмисляте твърде дълго кое място за паркиране искате, нали? Средата също е доста динамична!“