Lidské ladění:Ladění strojového vizuálního rozpoznávání prostřednictvím lidí ve smyčce

3 min read
Article updated on:25 Aug 2023

Původní článek: https://faculty.cc.gatech.edu/~parikh/human_debugging/


(NSF IIS 1115719, 1341772)

PI: Devi Parikh

Abstraktní

Problém vizuálního rozpoznávání je zásadní pro cíl automatického porozumění obrazu. Zatímco v komunitě počítačového vidění bylo vynaloženo velké množství úsilí, výkon strojů při těchto úkolech zůstává výrazně nižší než lidské schopnosti.  

Hlavním cílem tohoto projektu je využít nejznámější systém vizuálního rozpoznávání – systém vizuálního rozpoznávání lidí. Tento projekt využívá paradigma „Human Debugging“ k nahrazení různých součástí potrubí pro strojové vidění lidskými subjekty a zkoumá výsledný efekt na výkon rozpoznávání. Smysluplná srovnání poskytují cenné poznatky a vymezují aspekty systému strojového vidění, které představují překážky výkonu a vyžadují budoucí výzkumné úsilí. Konkrétně se projekt zabývá problematikou klasifikace obrazu a detekce objektů a zkoumá roli lokálních a globálních informací, jakož i dílčí detekce, prostorového modelování a kontextového uvažování (včetně nemaximálního potlačení) pro tyto problémy.  

Tento projekt se dotýká široké škály problémů ve vizuálním rozpoznávání včetně rozpoznávání objektů, rozpoznávání scén a detekce objektů. Toto nové paradigma identifikace slabých článků ve výpočetních modelech prostřednictvím lidí ve smyčce je také použitelné pro jiné problémy se zrakem, stejně jako další dílčí oblasti v AI. Sdílením všech shromážděných dat a výsledků a prostřednictvím organizovaných konferencí a workshopů tento projekt zahájí a podnítí dialog s výzkumnou komunitou o využití lidí k rozvoji počítačového vidění. V širším měřítku tato práce podporuje zapojení mladých žen a vysokoškolských studentů do výzkumu informatiky.

Datové sady

Opravy datové sady

Datový soubor opravy dílů

Datová sada atributů relativní tváře (29 atributů, 60 kategorií)

Publikace (částečně podporované NSF)

A. Bansal , A. Kowdle , D. Parikh, AC Gallagher a CL Zitnick

Na kterých hranách záleží?

Workshop on 3D Representation and Recognition (3dRR)  
International Conference on Computer Vision (ICCV), 2013 .

R. Mottaghi , S. Fidler , J. Yao , R. Urtasun a D. Parikh

Analýza sémantické segmentace pomocí hybridních CRF člověk-stroj

Konference IEEE o počítačovém vidění a rozpoznávání vzorů (CVPR), 20. 13

[ plakát ]

CL Žitnick a nd D . Parikh

Role porozumění obrazu při detekci kontur

Konference IEEE o počítačovém vidění a rozpoznávání vzorů (CVPR), 20. 12

[ stránka projektu ] [ data ] [ plakát ]

D. Parikh , CL Zitnick a T. Chen

Zkoumání malých obrázků: Role vzhledu a kontextových informací pro rozpoznávání strojů a lidských objektů

Analýza vzorů a strojová inteligence (PAMI), 2012 (bude uvedena)

D. Parikh a C. L. Zitnick

Lidské ladění strojů

Druhý workshop o počítačové sociální vědě a moudrosti davů

Neural Information Processing Systems (NIPS), 20 11

D. Parikh

Rozpoznávání neuspořádaných obrázků: Role místních a globálních informací při klasifikaci obrázků

Mezinárodní konference o počítačovém vidění (ICCV) , 20. 11

[ plakát ] [ snímky ]

C. Li , D. Parikh a T. Chen

Extrahování adaptivních kontextových podnětů z neoznačených oblastí

Mezinárodní konference o počítačovém vidění (ICCV), 20. 11

[ stránka projektu ]

CL Žitnick a nd D . Parikh

Zaměření sémantiky pomocí vizuální abstrakce

Konference IEEE o počítačovém vidění a rozpoznávání vzorů (CVPR), 20. 13(Ústní)

[ stránka projektu a data ] [hovor (video)] [diapozitivy] [plakát]

A. Biswasa D. Parikh

Současné aktivní učení klasifikátorů a atributů prostřednictvím relativní zpětné vazby

Konference IEEE o počítačovém vidění a rozpoznávání vzorů (CVPR), 20. 13

[ plakát ]

[ stránka projektu a data ] [ demo ]

Demo na IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 20 13 od

N. Agrawal, A. Biswas, A. Kovashka, K. Grauman a D. Parikh.

Související publikace (před podporou NSF)

D. Parikh a C. L. Zitnick Finding the Weakest Link in Person Detectors IEEE Conference on Computer Vision and Pattern Recognition (CVPR) , 2011 [ stránka projektu ] [ data ] [ poster ] [ snímky ]

D. Parikh a C. L. Zitnick

Role funkcí, algoritmů a dat ve vizuálním rozpoznávání

Konference IEEE o počítačovém vidění a rozpoznávání vzorů (CVPR) , 2010

[ plakát ] [ snímky ]

Postgraduální studenti podporováni

Roozbeh Mottaghi

Arijit Biswas

Podporováni vysokoškolští studenti

Yash Seth

Naman Agrawal

Jiuling Wang

Aayush Bansal

Article posted on:25 Aug 2023