Původní článek: https://faculty.cc.gatech.edu/~parikh/human_debugging/
(NSF IIS 1115719, 1341772)
PI: Devi Parikh
Abstraktní
Problém vizuálního rozpoznávání je zásadní pro cíl automatického porozumění obrazu. Zatímco v komunitě počítačového vidění bylo vynaloženo velké množství úsilí, výkon strojů při těchto úkolech zůstává výrazně nižší než lidské schopnosti.
Hlavním cílem tohoto projektu je využít nejznámější systém vizuálního rozpoznávání – systém vizuálního rozpoznávání lidí. Tento projekt využívá paradigma „Human Debugging“ k nahrazení různých součástí potrubí pro strojové vidění lidskými subjekty a zkoumá výsledný efekt na výkon rozpoznávání. Smysluplná srovnání poskytují cenné poznatky a vymezují aspekty systému strojového vidění, které představují překážky výkonu a vyžadují budoucí výzkumné úsilí. Konkrétně se projekt zabývá problematikou klasifikace obrazu a detekce objektů a zkoumá roli lokálních a globálních informací, jakož i dílčí detekce, prostorového modelování a kontextového uvažování (včetně nemaximálního potlačení) pro tyto problémy.
Tento projekt se dotýká široké škály problémů ve vizuálním rozpoznávání včetně rozpoznávání objektů, rozpoznávání scén a detekce objektů. Toto nové paradigma identifikace slabých článků ve výpočetních modelech prostřednictvím lidí ve smyčce je také použitelné pro jiné problémy se zrakem, stejně jako další dílčí oblasti v AI. Sdílením všech shromážděných dat a výsledků a prostřednictvím organizovaných konferencí a workshopů tento projekt zahájí a podnítí dialog s výzkumnou komunitou o využití lidí k rozvoji počítačového vidění. V širším měřítku tato práce podporuje zapojení mladých žen a vysokoškolských studentů do výzkumu informatiky.
Datové sady
Datová sada atributů relativní tváře (29 atributů, 60 kategorií)
Publikace (částečně podporované NSF)
A. Bansal , A. Kowdle , D. Parikh, AC Gallagher a CL Zitnick Workshop on 3D Representation and Recognition (3dRR) | |
R. Mottaghi , S. Fidler , J. Yao , R. Urtasun a D. Parikh Analýza sémantické segmentace pomocí hybridních CRF člověk-stroj Konference IEEE o počítačovém vidění a rozpoznávání vzorů (CVPR), 20. 13 [ plakát ] | |
CL Žitnick a nd D . Parikh Role porozumění obrazu při detekci kontur Konference IEEE o počítačovém vidění a rozpoznávání vzorů (CVPR), 20. 12 [ stránka projektu ] [ data ] [ plakát ] | |
D. Parikh , CL Zitnick a T. Chen Analýza vzorů a strojová inteligence (PAMI), 2012 (bude uvedena) | |
D. Parikh a C. L. Zitnick Druhý workshop o počítačové sociální vědě a moudrosti davů Neural Information Processing Systems (NIPS), 20 11 | |
D. Parikh Rozpoznávání neuspořádaných obrázků: Role místních a globálních informací při klasifikaci obrázků Mezinárodní konference o počítačovém vidění (ICCV) , 20. 11 | |
Extrahování adaptivních kontextových podnětů z neoznačených oblastí Mezinárodní konference o počítačovém vidění (ICCV), 20. 11 [ stránka projektu ] | |
CL Žitnick a nd D . Parikh Zaměření sémantiky pomocí vizuální abstrakce Konference IEEE o počítačovém vidění a rozpoznávání vzorů (CVPR), 20. 13(Ústní) [ stránka projektu a data ] [hovor (video)] [diapozitivy] [plakát] | |
A. Biswasa D. Parikh Současné aktivní učení klasifikátorů a atributů prostřednictvím relativní zpětné vazby Konference IEEE o počítačovém vidění a rozpoznávání vzorů (CVPR), 20. 13 [ plakát ] [ stránka projektu a data ] [ demo ] Demo na IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 20 13 od N. Agrawal, A. Biswas, A. Kovashka, K. Grauman a D. Parikh. |
Související publikace (před podporou NSF)
D. Parikh a C. L. Zitnick Finding the Weakest Link in Person Detectors IEEE Conference on Computer Vision and Pattern Recognition (CVPR) , 2011 [ stránka projektu ] [ data ] [ poster ] [ snímky ] | |
D. Parikh a C. L. Zitnick Role funkcí, algoritmů a dat ve vizuálním rozpoznávání Konference IEEE o počítačovém vidění a rozpoznávání vzorů (CVPR) , 2010 |
Postgraduální studenti podporováni
Podporováni vysokoškolští studenti
Yash Seth
Naman Agrawal
Jiuling Wang