安防之家訊:商品檢索是一門綜合了物體檢測、圖像分類以及特征學習的技術(shù)。近期,很多研究者成功地將深度學習方法應用到這個領(lǐng)域。本文對這些方法進行了總結(jié),然后概括地提出了商品特征學習框架以及垂類數(shù)據(jù)挖掘方式,最后介紹了商品檢索技術(shù)在服裝搭配中的應用。
前言
幾年前,當人們還在感嘆于網(wǎng)頁購物的快速便捷時,各大電商巨頭就“悄悄地”將它們的購物應用推廣到了用戶的手機里。從那一刻起,用戶購買的習慣也在悄悄地發(fā)生著改變:人們不再局限于時間與地點,只要擁有一部聯(lián)網(wǎng)的手機,就能輕松獲取想要的商品。發(fā)展至今,移動設備的安全、高速等特點越來越獲得人們的認可,也使得移動購物行為變得更加普遍。然而目前PC和Mobile終端中,用戶基本都是通過文本關(guān)鍵詞獲取目標商品,這種單一的關(guān)鍵詞描述有時很難獲取用戶的真實需求。
為此,電商們也進行了很多改進。其中最有效的一些做法是構(gòu)建高度結(jié)構(gòu)化的后臺商品數(shù)據(jù)庫。其目的是能夠通過分析用戶的查詢來推薦一些更加精細粒度、時效性好、熱度高的商品品類,并提供給用戶一個限定了價格、品牌、風格等等的商品候選集合。這種基于文本的由粗到精的推薦方式,能夠很好的幫助用戶定位到具有精細且具體標簽的商品。然而,當用戶需求的商品的周邊信息不明確時,很難通過抽象出有限的關(guān)鍵詞來進行檢索。這類商品包括:未知品牌的化妝品,樣式新穎的
家具或者時尚流行的服裝等(如圖1)。
圖1:一些難以用關(guān)鍵詞描述的商品
所見即所得
對于上述的問題,可以用一句話歸結(jié)為:當需求物品難以用文本量化描述時, 給定它的一張圖像,是否有可能推薦給用戶相關(guān)的商品? 可以想象這樣的場景: 當你看到一件喜歡的物品,只通過手機拍照將其圖像上傳購物網(wǎng)站,就能獲取實物購買信息。如果商品檢索能做到這樣的“所見即所得”, 必將會給有購物需求的用戶帶來很大的便捷。
“所見”如何才能變成“所得”呢? 在回答這個問題之前, 首先需要了解商品檢索中的難點問題:
商品品類繁多
小到柴米油鹽,大到家具
電器, 都可以稱為商品。而且很多商品都包括多級且細致的分類,例如,家具可分為臥室家具、客廳家具、餐廳家具、書房家具等;服裝的一級品類包括女裝、男裝、內(nèi)衣、配飾與童裝童鞋等, 女裝又可分為連衣裙、T恤、雪紡衫等; 母嬰中的童車童床類別可分為安全座椅、嬰兒推車、嬰兒床、嬰兒床、墊餐、椅學步車等。由此可見, 好的檢索技術(shù)不僅要識別這么多的商品類別, 并且需要區(qū)分每個類別下的不同商品實例; 同時后臺商品數(shù)據(jù)庫應該具有很高的覆蓋面。
圖2:多種多樣的商品
同款與相似款的混淆
根據(jù)多級類目或?qū)傩赃M行商品劃分的方式,盡管區(qū)分了大多數(shù)具有精細語義的商品,但在區(qū)分同款與相似款上的作用仍然是有限的,即無法確認兩件分為一個類別的商品是相同款。 舉例來說,已知兩個人都穿著白色短袖圓領(lǐng)T恤, 因為姿態(tài)、角度、光照等影響,有可能會使得相似款更像同款,或者同款被誤識別為相似款。這就是計算機視覺中經(jīng)常碰到的類內(nèi)差異性與類間相似性問題。圖3的例子可以說明這兩個問題。 左側(cè)(a)中的上衣是同一款衣服,但由于人體姿態(tài)、懸掛方式、手臂遮擋、光線等問題的存在,使得它的顏色以及長度等表觀屬性具有很大的差異性;三款相似的黑色印花連衣裙如(b)所示,它們擁有相似的不規(guī)則的印花圖案,以及黑色的底色和A字裙擺;這些特點都讓他們很相似,但從袖型可看出它們非同款。
圖3:同款與相似款服飾圖像
其實,計算機視覺的各個領(lǐng)域都在解決這樣的“所見即所得”難題, 即如何讓
機器能夠自動準確的理解圖像內(nèi)容。隨著深度學習的興起, 包括人臉識別、 圖像分類與物體檢測在內(nèi)的方向都取得了很多重要的進展, 也為深度學習在商品檢索中的應用奠定了堅實的基礎(chǔ)。
安防之家專注于各種
家居的安防,
監(jiān)控,
防盜,安防監(jiān)控,安防器材,安防設備的新聞資訊和O2O電商導購服務,敬請登陸安防之家:http://anfang.jc68.com/