能夠識(shí)別圖片中的物體的智能工具

時(shí)間：2015-05-21 09:28:35 來源：作者：智界科技

QQ圖片20150521093446.png

人工智能研究最有趣的領(lǐng)域之一就是計(jì)算機(jī)視覺（computer vision），從無人駕駛汽車內(nèi)部構(gòu)件到機(jī)器猜年齡，計(jì)算機(jī)視覺系統(tǒng)軟件擁有著很大的開發(fā)潛能。

近期，計(jì)算機(jī)科學(xué)家史蒂芬·沃爾夫勒姆（Stephen Wolfram）發(fā)布了一種新工具，名叫“沃爾夫勒姆圖片識(shí)別項(xiàng)目”（ Wolfram Image Identification Project）。用戶借助這項(xiàng)工具首先需要上傳或者鏈接到一張圖片，然后就可以看到計(jì)算機(jī)如何來識(shí)別圖片中物體。

沃爾夫勒姆是這樣描述他的工具的：跟很多計(jì)算機(jī)視覺項(xiàng)目不同，沃爾夫勒姆項(xiàng)目圍繞一種“人工神經(jīng)網(wǎng)絡(luò)”而建立。人工神經(jīng)網(wǎng)絡(luò)實(shí)際上是一種軟件框架，它的設(shè)計(jì)靈感來自能夠進(jìn)行圖片識(shí)別的生物大腦。沃爾夫勒姆構(gòu)造的“人工神經(jīng)網(wǎng)絡(luò)”是可以通過數(shù)千萬標(biāo)簽圖片“訓(xùn)練”出來的。

“我們不需要用老方法來描述一個(gè)物體，比如椅子。我們所做的一切就是提供很多類型的椅子。你也可以這么說，‘任何跟我們想將其定義為椅子的物體’。這樣，我們就會(huì)把那些跟我們所定義的‘椅子’很接近圖片貼上‘椅子’標(biāo)簽，其他則排除在外。”沃爾夫勒姆表示。

Business Insider網(wǎng)站通過測(cè)試發(fā)現(xiàn)，在多數(shù)情況下，這款圖片識(shí)別器能夠至少抓住圖片中的“關(guān)鍵點(diǎn)”。比如，它能夠?qū)⑾＠?middot;克林頓和瑪麗莎·梅耶爾準(zhǔn)確地歸類為“人”，不過它無法識(shí)別按名字來識(shí)別出他們。它能夠?qū)aris cafe Le Comptoir歸類為“一座建筑”。

不過，在某些情況下，沃爾夫勒姆識(shí)別工具會(huì)完全忽略掉圖片中的人，將焦點(diǎn)集中于某些沒有生命的物體上。比如，在拳王格羅夫金（Gennady Golovkin）一張拳擊比賽圖片中，這項(xiàng)算法鎖定在了拳擊手套上，并提供了有關(guān)這雙拳擊手套的其他信息，比如重量和材質(zhì)。

在另一張肯德基宣傳廣告圖片中，該算法忽視掉了里面的主人公，只是將焦點(diǎn)放在了主人公身旁的汽車，并將其識(shí)別為“交通”。

對(duì)于三星手機(jī)，這項(xiàng)工具將其識(shí)別為“遠(yuǎn)程控制”，跟上面提到的拳擊手套一樣，系統(tǒng)還提供一些文字介紹。

在這張?zhí)厮估噲D片中，系統(tǒng)注意到了汽車前面站立的人（特斯拉CEO馬斯克），但是它將馬斯克身后的汽車歸類為“兩門”小轎車，而不是四門汽車。

在另一張視頻游戲Doom4截圖中，系統(tǒng)將圖片中的士兵竟然識(shí)別為一只“蜘蛛”，并在下面提供有關(guān)這類蜘蛛的名稱和最大年齡信息。

智能界（m.jwnfls.cn）是中國(guó)首家專注于報(bào)道智能科技前沿的綜合垂直門戶，秉承“引領(lǐng)未來智能生活”的理念，持續(xù)關(guān)注智能家居、可穿戴設(shè)備、智能醫(yī)療、機(jī)器人、3D打印、智駕等諸多科技前沿領(lǐng)域，提供最前沿、最時(shí)尚、最實(shí)用、最專業(yè)的硬件產(chǎn)品介紹、硬件評(píng)測(cè)、服務(wù)定制、最新資訊、圈子交流等服務(wù)，致力于成為最具價(jià)值的智能科技信息互動(dòng)平臺(tái)。

智能界【微信公眾號(hào)ID：znjchina】【新浪/騰訊微博：@智能界】

QQ圖片20150410113851.jpg