Компјутери, Информационе технологије

Модерна компјутерска визија. Задаци и Цомпутер Висион технологије. Програмирање рачунара Визија у Питхон

Како научити рачунар да разуме шта је приказано на слици или слика? То изгледа једноставно, али за рачунаром ово је само матрица се састоји од нула и јединица из које желите да издвојите важне информације.

Шта је рачунар визија? То је способност да "виде" рачунара

Визија - је важан извор информација за особе која га користи, добијамо, према различитим проценама, од 70 до 90% свих информација. И, наравно, ако желимо да створимо смарт ауто, морамо да уведе исте вештине и рачунар.

Проблем компјутерске визије може бити сасвим јасно. Шта је "видети"? Подразумева се да тамо где само не постоје гледајући. То закључили су разлике у компјутерске визије и људског вида. Визија за нас - то је извор знања о свету, као и извор метричке информација - то јест, способност да разуме растојања и величине.

Семантички језгро слика

Гледајући слику, можемо описати низом особина, да тако кажемо, да извуку семантичке информације.

На пример, гледајући ову слику, можемо рећи да је напољу. Шта је градски саобраћај. Да постоје возила. можемо Претпостављам да је ово Југоисточна Азија од конфигурације зграде и хијероглифима. Портрет Мао Зедонг схвате да је ово Пекинг, а ако неко видео видео уживо или је сам тамо, претпостављам да је ово позната Тјенанмен.

Оно што можемо рећи више о слици, да види? Можемо да идентификују објекте у слици, да кажем, да постоје људи овде ближе - ограда. Овде сунцобрани, постери тој згради је. Ово су примери наставе је веома важна предмети, који су ангажовани у потрази за тренутак.

Ипак можемо научити неке од карактеристика или особина објеката. На пример, овде можемо утврдити да ово није портрет обичног Кинеза, наиме, Мао Зедонг.

Према возило може да се утврди да је објекат у покрету, а то је тешко, да се не деформише током кретања. О заставе може се рећи да је објекте, они су такође креће, али они нису тешко, стално деформише. А у сцени је ветар, који се може одредити развој заставе, а може чак одредити правац ветра, на пример, да се дува с лева на десно.

Раздаљине и дужине у компјутерске визије

Врло је важна показатељ информације о рачунар вида науци. То је све врсте растојања. На пример, за ровера је посебно важно, јер су екипе из Земље око 20 минута и одговорити колико. Сходно томе, веза тамо и назад - 40 минута. А ако се направи план за кретање команде на Земљи, треба да узме у обзир.

Успешно интегрисани технологију компјутерске визије у видео играма. Према видео, можете изградити тродимензионалне моделе објеката, људи, и фотографије на корисник може повратити тродимензионалне моделе градова. А онда ходати по њима.

Цомпутер Висион - прилично широк опсег. То је тесно повезано са разним другим наукама. Део компјутерског вида Она обухвата површину за обраду слика и понекад издваја рачунара визију, историјски.

Анализа, паттерн рецогнитион - пут ка стварању супериорне интелигенције

Размотримо ове концепте посебно.

Обрада слике - ово је област алгоритама, у којој је улаз и излаз - слика, а имамо га да ради нешто.

анализа слике - је област компјутерске визије, која се фокусира на рад са дводимензионалне слике и доносе закључке из тога.

Паттерн Рецогнитион - апстрактни математички дисциплина која препознаје податке у облику вектора. То је, на улазној - вектора и морамо неке везе са тим. Где је вектор, нисмо толико важно да се зна.

Цомпутер Висион - је првобитно био да поврати структуру дводимензионалне слике. Данас ово подручје је постало шири и може се тумачити као прихватање свих физичких објеката доносе на основу слике. То јест, то је задатак вештачке интелигенције.

Паралелно са компјутерске визије у потпуно различитих области, у геодезије, фотограметрија је еволуирала - мерење растојања између објеката на дводимензионалне слике.

Роботи могу да "виде"

И на крају - ово је машина визија. Под машинске визије подразумева визију робота. То је одлука неких проблема производње. Можемо рећи да је рачунар визија - је једна велика наука. Она комбинује неке друге науке дела. И када је рачунар визија добија неку посебну апликацију, она се претвара у машине визију.

Визију рачунара регија има масу од практичне примене. Он је повезан са аутоматизацију производње. На предузећа постају ефикасније да замени физички рад машином. Машина не уморе, не спава, она је неправилан распоред рада, она је спремна да ради 365 дана у години. Дакле, користећи машину да ради, можемо добити гарантовано резултат на одређено време, и то је веома интересантно. Сви задаци имају јасну користи за системе Цомпутер Висион. И не постоји ништа боље него да одмах виде резултате на слици само у обрачун фази.

На прагу света вештачке интелигенције

Плус простор - тешко! Значајан део мозга који је одговоран за визију, а верује се да ако научити рачунар да "види", који је, пуна примена рачунарски вид, то је један од циљева пуне вештачке интелигенције. Ако можемо решити проблем на људском нивоу, највероватније у исто време, ми ћемо решити проблем АИ. То је веома добро! Или није добро, ако погледате, филма "Терминатор 2".

Зашто је визија - да ли је тешко? Јер слика истог објекта може да варира знатно у зависности од спољашњих фактора. У зависности од предмета осматрачница изгледају другачије.

На пример, један исти слици, преузет из различитих углова. А оно што је најинтересантније на слици може бити једно око, два ока и по. И у зависности од контекста (ако је слика човека у мајици са обојеним очима), око може бити више од два.

Рачунар и даље не разуме, али је "види"

Други фактор који отежава - то је осветљење. Исто сцена са различитим осветљењем ће изгледати другачије. величина објекта може да варира. Поред тога, објекти било које класе. Како можете рећи о човеку који му је висина од 2 метра? Ништа. Хуман гровтх а може бити 2.3 м, и 80 цм. Као и са другим типовима објеката, међутим, објекти исте класе.

Посебно живе објекти пролазе кроз различите сојева. Хаир људи, спортисти, животиње. Погледајте слике коња раде, утврдити шта се дешава са њиховим грива и реп је једноставно немогуће. А преклапају објекте у слици? Ако ти ставио слику са рачунара, чак и најмоћнији машину наилазе на потешкоће да дају праву одлуку.

Следећи приказ - То је маска. Неки предмети, животиње маскиран у окружењу, и прилично вешто. А исте тачке и бојење. Ипак, ми их видимо, мада не увек издалека.

Још један проблем - покрет. Објекти у покрету незамисливе подвргнути деформацију.

Многи од објеката су веома променљива. Ево, на пример, у две фотографије испод објектима "столице".

А на то можете сести. Али да научи машину, тако да су различите ствари у облику, боји, материјала, све је објекат "столица" - је веома тешко. Ово је изазов. Да се интегришу метода компјутерског вида - да научи машину да разумеју, анализирају, спекулише.

Интеграција компјутерске визије у разним платформама

Маса компјутерске визије почела да продре још 2001. године, када је створио првог лица детектор. Виола Џонс: ми да два аутора је. То је био први брз и поуздан довољно алгоритам, који је показао моћ метода машинског учења.

Сада рачунар визија има довољно нових практичну примену - признавање људског лица.

Али да препознају човека као у филмовима - у случајним угловима, различитим условима осветљења - то је немогуће. Али да се реши проблем, или онај који је другачије људе са различитим осветљење или на други пози, слично као на фотографији у пасошу, могуће је са високим степеном поверења.

Пасош фото захтеви углавном због карактеристика алгоритама за препознавање лица.

На пример, ако имају биометријски пасош, у неким модерним аеродромима, можете користити аутоматски систем за контролу пасоша.

Нерешен проблем компјутерског вида - способност да препозна било који текст

Можда је неко користи ОЦР систем. Један од њих - а Фине Реадер, веома је популаран у РуНет систему. Постоје многи облици где се попуњава у подацима, они су савршено скенирани, информације се признаје од стране система веома добро. Али, са било којим текстом на слици ситуација је много гора. Овај проблем и даље остаје нерешен.

Игре које укључују компјутерски визију, Мотион Цаптуре

Одвојено велике површине - је стварање тродимензионалних модела и хватање покрета (што је сасвим успешно спроводи у компјутерским играма). Први програм, који користи компјутер визију - систем интеракције са рачунар помоћу гестова. Када је створена да је много ствари отворених.

Алгоритам је дизајниран једноставно, али да подесите је требало да створи генератор синтетичких слика људи да се милион слика. Суперкомпјутер са њима да изаберу параметре алгоритма, за који је сада добро ради.

То је милион слика и недељу време пребројива суперкомпјутер могуће направити алгоритам који троши 12% од капацитета једног процесора и омогућава особи да сагледа положај у реалном времену. Овај Мицрософт Кинецт систем (2010).

Тражење слике по садржају вам омогућава да поставите фотографије на систем, а резултати тога ће дати све слике са истим садржајем и од истог угла.

Примери компјутерске визије: тродимензионалне и дводимензионалне мапе су сада се са њом. Карте за навигацију возила се редовно ажурира у складу са ДВР.

Постоји база података са милијардама географски означених фотографија. Преузимањем слику у бази података, можете одредити где је направљен, па чак и са неким перспективе. Наравно, под условом да је место је довољно да популаран у једном тренутку су туристи и направио неколико фотографија са подручја био тамо.

роботи су свуда

Роботика у овом тренутку, свуда, без њега на било који начин. Сада постоје возила која имају посебне камере које препознају пешаке и путоказе за слање команде возача (ово на неки начин компјутерски програм да видите, помаже возач). И ту је потпуно аутоматизована роботских возила, али они не могу да се ослоне само на систему видео камером без употребе велике количине додатних информација.

Модерна камера - ово је Обсцура аналогни фотоапарат

Хајде да причамо о дигиталном сликом. Модерни дигитални фотоапарати су распоређени на принципу Цамера Обсцура. Само уместо рупе кроз које светлост улази у зрак и пројектованог на задњем зиду коморе предметне кола, имамо посебан оптички систем под називом сочиво. Његов циљ је да прикупи велики светлосни сноп и претворити га тако да сви зраци прошли кроз виртуелне тачку у циљу добијања пројекцију и формира слику о филму или матрицу.

Модерни дигитални фотоапарати (матрица) се састоји од појединих елемената - пиксела. Сваки пиксел може да измери енергију светлости која је инцидент на пиксела укупно, и издаје један излаз број. Према томе, у дигиталном камером, добијамо уместо осветљења слика скуп лаких мерења, ухваћених у један пиксел - компјутерски видно поље. Стога, када је слика коју видимо се не тече линије и јасне контуре, и мрежу од обојених квадрата у различитим бојама - пиксела.

Испод можете видети прву дигиталну слику у свету.

Али на овој слици није? Боја. Шта је боје?

Психолошка перцепција боја

Боја - то је оно што видимо. Боја једне те исте ствари за људе и мачке ће бити другачије. Пошто смо ми (људи) и животиња оптичког система - визија је другачије. Стога, боја - то је психолошки квалитет наше визије које се јавља када посматрајући објекте и светлост. А не физички власништво објекта и светлости. Боја - је резултат интеракције лаких компоненти, и на сцени нашег визуелног система.

Програмирање рачунара Визија у Питхон користе библиотекама

Ако сте одлучили да се озбиљно ангажују у истраживању компјутерског вида, треба одмах припремити за бројним тешкоћама, ова наука није најлакши и скрива велики број замки. Али "Програмирање рачунара Визија на Питхон" ауторства Јан Ерик Солема - књиге који приказује све нај једноставан језик. Овде ћете се упознати са методама препознавања различитих објеката у 3Д, науче да раде са стерео слике, виртуелне стварности и многе друге примене компјутерског вида. У књизи су довољно примера у Питхон. Али објашњења су представљени, да тако кажем, генерализује, тако да не преоптерети превише истраживања и података са хард. Раде погодан за студенте, аматере и ентузијасте. Преузмите ову књигу и друге о рачунар Висион (пдф-формату) могу бити у мрежи.

У овом тренутку, има извор библиотека отворена за Цомпутер Висион алгоритама и обраду слике и нумерички алгоритми ОпенЦВ. спроводи се на већини модерних програмских језика, је опен соурце. Ако говоримо о компјутерске визије, Питон користи као програмски језик, такође има подршку библиотеке, поред тога, она је стално развија и има велику заједницу.

Компанија "Мајкрософт" нуди своје услуге АПИ-у стању да тренира неуронске мреже да то раде са сликама људи. Такође постоји могућност да се примени рачунара визију, Питон користи као програмски језик.

Компјутери, Информационе технологије

Модерна компјутерска визија. Задаци и Цомпутер Висион технологије. Програмирање рачунара Визија у Питхон

Шта је рачунар визија? То је способност да "виде" рачунара

Семантички језгро слика

Раздаљине и дужине у компјутерске визије

Анализа, паттерн рецогнитион - пут ка стварању супериорне интелигенције

Роботи могу да "виде"

На прагу света вештачке интелигенције

Рачунар и даље не разуме, али је "види"

Интеграција компјутерске визије у разним платформама

Нерешен проблем компјутерског вида - способност да препозна било који текст

Игре које укључују компјутерски визију, Мотион Цаптуре

роботи су свуда

Модерна камера - ово је Обсцура аналогни фотоапарат

Психолошка перцепција боја

Програмирање рачунара Визија у Питхон користе библиотекама

Similar articles

Компјутери

Компјутери

Компјутери

Компјутери

Компјутери

Компјутери

Trending Now

Здравље

Новости и друштво

Посао

Здравље

Компјутери

Посао

Newest

Интелектуални развој

Уметност и забава

Бизнис

Дом и породица

Храна и пиће

Вести и друштво