RačunalnikiInformacijska tehnologija

Sodobna računalniški vid. Naloge in računalniški vid tehnologije. Programiranje Računalniški vid v Python

Kako naučiti računalnik razumeti, kaj je prikazano na sliki ali slike? To se zdi preprosto, vendar pa za računalnik je to samo matrika sestavljena iz ničel in enic, iz katerega želite izločiti pomembne informacije.

Kaj je računalniški vid? To je sposobnost, da "videti" računalnik

Vizija - je pomemben vir informacij za osebe, ki ga uporablja, dobimo, po različnih ocenah od 70 do 90% vseh informacij. In, seveda, če želimo ustvariti pametno avto, moramo izvajati iste spretnosti in računalnik.

Problem računalniškega vida se lahko povsem jasno navedeno. Kaj je "videti"? Razume se, da so v kateri samo jih je videti. Da sklenila razlike računalniškega vida in človeškega vida. Vizija za nas - to je vir znanja o svetu, kot tudi vir metričnih informacij - to je sposobnost razumeti razdalje in velikosti.

Semantično slika jedra

Če pogledamo slike, ga lahko opisali z več atributov, tako rekoč, za pridobivanje semantične informacije.

Na primer, je videti na tej sliki, lahko rečemo, da je na prostem. Kaj je mestni promet. To so avtomobili. lahko uganiti, da je to Jugovzhodna Azija od konfiguracije objekta in hieroglifi. Portret Mao Zedong razumeti, da je to v Pekingu, in če je kdo videl video v živo ali sam je bil tam, bi bilo uganiti, da je ta slavni na Trgu nebeškega miru.

Kaj nam lahko pove več o sliki, da jo vidijo? Mi lahko prepoznajo predmete na sliki, se pravi, da so ljudje tukaj bližje - ograja. Tu dežniki, plakati te stavbe. To so primeri razredov so zelo pomembni objekti, ki se ukvarjajo z iskanjem trenutku.

Še vedno se lahko naučimo nekatere značilnosti ali lastnosti objektov. Na primer, tu lahko ugotovimo, da ne gre za portret navadnih Kitajcev, in sicer, Mao Zedong.

Glede na vozilu, se lahko določi, da je premikanje predmeta, in da je težko, da se ne deformirajo med gibanjem. O se zastave lahko rečemo, da temu nasprotuje, so prav tako gibljejo, vendar jih ni težko, nenehno deformira. In na sceni pa je veter, ki se lahko določi z razvojem zastave, in lahko celo določi smer vetra, na primer, je piha od leve proti desni.

Razdalje in dolžine v računalniškega vida

Zelo pomembno je, metrični podatki o računalniški vid znanosti. To je vse vrste razdalj. Na primer, za rover je še posebej pomembno, saj so ekipe iz Zemlje približno 20 minut in odgovoriti na čim več. Zato je povezava tja in nazaj - 40 minut. In če naredimo načrt za ukaze gibanja Zemlje, boste morali to upoštevati.

Uspešno integrirali tehnologijo računalniškega vida v video igrah. Glede na video, se lahko gradijo tridimenzionalne modele predmetov, ljudi in fotografij na uporabnika lahko obnovite tridimenzionalne modele mest. In potem hodi na njih.

računalniški vid - precej širok razpon. To je tesno povezana z različnimi drugimi znanostmi. Del računalniškega vida To zajema območje za obdelavo slike in včasih razporeja računalniški vid, zgodovinsko.

Analiza, razpoznavanje vzorcev - pot k ustvarjanju višje inteligence

Oglejmo si te koncepte ločeno.

Obdelava slike - da je to področje algoritmov, v katerem je vhod in izhod - slike, in smo mu nekaj storiti.

Analiza slik - je področje računalniškega vida, ki se osredotoča na delo z dvodimenzionalne slike in da ugotovitve iz tega.

Pattern Recognition - abstraktna matematična disciplina, ki prepozna podatke v obliki vektorjev. To pomeni, da na vhodu - vektor in imamo kaj opraviti s tem. Če je vektor, nismo tako pomembno vedeti.

Računalniški vid - prvotno je bil obnoviti strukturo dvodimenzionalnih podob. Danes je to področje postalo širše in ga je mogoče razlagati tako, da sprejema vse fizičnih predmetov izdelavo, ki temelji na sliko. To pomeni, da je naloga umetne inteligence.

Vzporedno z računalniškega vida v povsem drugem področju, v geodeziji, je fotogrametrija razvil - merjenje razdalje med objekti na dvodimenzionalnih podob.

Roboti lahko "videli"

In na koncu - to je strojni vid. Pod strojnega vida pomeni vizijo roboti. To je odločitev nekaterih proizvodnih problemov. Lahko rečemo, da računalniški vid - je ena velika znanost. Združuje nekatere druge znanosti dela. In ko je računalniški vid dobi nobene posebne vloge, se izkaže v strojnega vida.

Računalniški vid regija ima maso praktičnih aplikacijah. To je povezano z avtomatizacijo proizvodnje. Na podjetja postanejo bolj učinkoviti kot zamenjava ročno delo s strojem. Stroj ne utrudijo, ne spi, je imela nepravilno delovni urnik, ona je pripravljena delati 365 dni na leto. Torej, z uporabo strojnega dela, bomo lahko dobili zagotovljeno rezultat v določenem času, in to je zelo zanimivo. Vse naloge so jasno uporabljajo za sisteme računalniškega vida. In ni nič bolje kot, da takoj videli rezultate na sliki le v fazi izračuna.

Na pragu svetu umetne inteligence

Plus območje - to je težko! Pomemben del možganov, odgovoren za vid, in je verjel, da če naučiti računalnik "videti", da se je v celoti uporabi računalniški vid, da je eden od ciljev polne umetne inteligence. Če bi lahko rešili problem na človeški ravni, najverjetneje ob istem času, bomo rešili problem AI. To je zelo dobra! Ali ni zelo dobra, če pogledaš, "Terminator 2".

Zakaj je vizija - to je težko? Ker lahko slika na isti objekt, se zelo razlikujejo, odvisno od zunanjih dejavnikov. Odvisno od predmeta opazovalnih točk videti drugačen.

Na primer, ena in ista slika, vzeta iz različnih zornih kotov. In kar je najbolj zanimivo, na sliki je lahko eno oko, dve oči in pol. In glede na kontekst (če je ta podoba človeka v srajco z naslikanimi očmi), oko je lahko več kot dva.

Računalnik še vedno ne razume, vendar pa "vidi"

Še en dejavnik, ki otežuje - to je osvetlitev. Isti prizor z različno osvetlitvijo bo videti drugačna. velikost predmeta lahko razlikujejo. Poleg tega predmeti vsakem razredu. Kako lahko rekli o človeku, da je njegova višina 2 metra? Nič. Človeški rastni in je lahko 2,3 m in 80 cm. Kot pri drugih vrstah objektov pa so predmeti istega razreda.

Posebej živijo predmetov opraviti različne sevov. Hair ljudje, športniki, živali. Poglej slike konjev, ugotoviti, kaj se dogaja z njihovo grivo in rep je preprosto nemogoče. A prekrivajo predmete v sliko? Če zabil računalniško sliko, tudi najbolj zmogljiv stroj zdi težko dati pravo odločitev.

Naslednji pogled - to je krinka. Nekateri predmeti, živali maškarada kot so okolje, in zelo spretno. In ista mesta in barvanje. Kljub temu pa smo jih videli, čeprav ne vedno od daleč.

Še en problem - gibanje. Objekti v gibanju nepredstavljivo opravi deformacijo.

Številni predmeti so zelo različni. Tukaj, na primer, v dveh fotografijah spodaj predmete iz "stol".

In o tem si lahko sedel. Toda naučiti stroj, tako da vse, kar je različne stvari v obliko, barvo, material predmet "stol" - je zelo težko. To je izziv. Za vključitev metod računalniškega vida - je naučiti stroj razumeti, analizirati, špekulirati.

Integracija računalniškega vida v različnih platformah

Masa računalniškega vida se je začela prodirati več v letu 2001, ko je ustvaril prvi detektor obraz. Naredili smo to dva avtorja: Viola, Jones. To je bil prvi hiter in zanesljiv dovolj algoritem, ki je pokazala moč metod strojnega učenja.

Zdaj računalniški vid imeli dovolj nove praktične aplikacije - priznanje človeškega obraza.

Ampak, da prepozna človeka kot v filmih - naključno kotov, različne svetlobne pogoje - to je nemogoče. Toda za rešitev problema, ali tisto, ki je različnih ljudi z različnimi razsvetljavo ali v drugačni pozi, podobno kot na fotografiji v potnem listu, je mogoče z visoko stopnjo zaupanja.

a potni list, fotografijo zahteve v veliki meri zaradi značilnost algoritmov prepoznavanja obraza.

Na primer, če imate biometrični potni list, v nekaterih sodobnih letališčih, lahko uporabite avtomatskega sistema za vodenje potni list.

Nerešen problem računalniškega vida - sposobnost prepoznavanja nobenega besedila

Mogoče kdo uporablja OCR sistem. Eden od njih - Fine Reader, je zelo priljubljena v RuNet sistemu. Obstaja veliko oblik, kjer izpolnite podatke, so popolnoma skenirane, podatki se pripoznajo, ki jih je sistem zelo dobro. Ampak s katero koli besedilo v sliki je stanje veliko slabše. Ta problem še vedno ostaja nerešen.

Igre, ki vključujejo računalniški vid, zajemanje gibanja

Ločeno velike površine - je ustvarjanje tridimenzionalnih modelov in zajemanja gibanja (ki je zelo uspešno izvaja v računalniških igrah). Prvi program, ki uporablja računalniški vid - sistem interakcijo z računalnikom z uporabo kretenj. Ko je bila ustvarjena, da je veliko stvari odprtih.

Algoritem je zasnovan preprosto, vendar konfigurirati je trajalo, da ustvari generator sintetičnih podob ljudi, da bi dobili milijon slik. Superračunalnik z njimi izbrati parametre algoritma, za katerega je zdaj dobro deluje.

To je milijon slik in teden prešteje superračunalnik čas mogoče ustvariti algoritem, ki porabi 12% prostornine enega procesorja in omogoča človeku, da zaznava položaj v realnem času. Ta sistem Microsoft Kinect (2010).

Iskanje slik z vsebino, vam omogoča nalaganje fotografij v sistemu, in rezultati to bo dala vse slike z enako vsebino in iz istega zornega kota.

Primeri računalniškega vida: tridimenzionalna in dvodimenzionalne zemljevidi zdaj se z njo. Zemljevidi za navigacijo vozil se redno posodabljajo v skladu z DVR.

Na voljo je podatkovna baza z več milijard geooznačenih fotografij. S prenosom slike v zbirki podatkov, lahko ugotovite, kje je bil narejen, in celo z nekaj perspektive. Seveda pod pogojem, da je mesto dovolj, da je priljubljen naenkrat turisti in je nekaj fotografij na območju so bili tam.

roboti so povsod

Robotika v tem času, povsod, ne da bi na kakršen koli način. Zdaj pa so vozila, ki imajo posebne kamere, ki prepoznajo pešce in prometne znake, da posredujejo ukaze voznika (to na način, računalniški program za ogled, pomaga motorist). In tam je popolnoma avtomatizirano robotsko vozil, vendar se ne more zanašati le na sistem video kamer brez uporabe velike količine dodatne informacije.

Sodobna kamera - to je obscura analogni fotoaparat

Spregovorimo o digitalni sliki. Sodobni digitalni fotoaparati so razporejeni na načelu obscura kamero. Le namesto luknjo, skozi katero svetloba vstopa v žarek in projicira na zadnji steni komore predmeta vezja, imamo poseben optični sistem, imenovan objektiv. Njen cilj je zbrati velik svetlobni snop in ga spremeniti tako, da se vsi žarki skozi virtualno točko, da bi dobili projekcije in tvori sliko na filmu ali matrici.

Sodobni digitalni fotoaparati (matrica), ki je sestavljen iz posameznih elementov - pikslov. Vsak piksel lahko izmerimo energijo svetlobe, ki je incident na pixel skupaj, in izda eno izhodno številko. Zato je v digitalni fotoaparat, dobimo namesto meritev set lahkih svetlosti slik, ujetih v enem slikovnih pik - računalnik vidno polje. Zato, ko je slika vidimo ne teče linije in jasne obrise, in mrežo barvnih kvadratov v različnih barvah - pikslov.

Spodaj si oglejte prvo digitalno sliko na svetu.

Toda v tej sliki ni? Color. Kaj je barva?

Psihološko dojemanje barv

Barva - to je tisto, kar vidimo. Barva za eno in isto stvar, za ljudi in mačke bo drugače. Ker smo (ljudeh) in živali optičnim sistemom - vizija je drugačna. Zato, barva - to je psihološko kakovost naše vizije, ki se pojavi, ko opazuje predmete in svetlobo. In ni fizikalna lastnost objekta in luči. Barva - je rezultat interakcije lahkih komponent, in prizorišče našega vidnega sistema.

Programiranje Računalniški vid v Python z uporabo knjižnic

Če ste se odločili za resno sodelovanje v študiji računalniškega vida, je treba takoj pripraviti na številne težave, ta znanost ni najlažja in skriva številne pasti. Toda "Programiranje računalniški vid na Python" avtorstvu Jan Erik Solema - knjigo, ki opisuje vse najbolj preprost jezik. Tukaj boste seznanili z metodami za prepoznavanje različnih predmetov v 3D, se naučijo delati s stereo slike, navidezna resničnost in številne druge aplikacije računalniškega vida. V knjigi so dovolj primerov v Python. Vendar pa so predstavljena pojasnila, tako rekoč, posplošiti, da ne preobremenite preveč raziskave in trdih podatkov. Delo primerna za študente, amaterje in navdušence. Prenesti to knjigo in druge o računalniški vid (pdf-formatu) lahko v omrežju.

Trenutno obstaja open source knjižnica računalniškega vida algoritmov in obdelavo slik ter numeričnih algoritmov OpenCV. To se izvaja na večini sodobnih programskih jezikov, je open source. Če govorimo o računalniškega vida, Python uporablja kot programski jezik, ima tudi podporo knjižnici, poleg tega pa se nenehno razvija in ima velik skupnosti.

Podjetje "Microsoft" ponuja svoje storitve Api-lahko vlak nevronske mreže, da je delo s slikami ljudi. Obstaja tudi možnost, da se uporabljajo računalniški vid, Python uporablja kot programskega jezika.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 sl.delachieve.com. Theme powered by WordPress.