機器學習需要大量人工標註,尤其是深度學習,有沒有什麼好辦法解決?

時間 2021-05-30 18:17:57

1樓:曼孚科技

專業的資料標註企業可以提供大量、高質量的標註資料集。

借助AI預標註技術,標註過程中可以減輕對人力的依賴,提公升效率、降低成本。

2樓:網感至察

對於機器學習來說,大量的人工標註是很繁瑣的,我們可以通過基於通用的知識圖譜引擎和技術框架,使用深度學習來優化已有的知識體系中不准、不全和不夠靈活的地方,為各行各業輸出知識圖譜建設和知識推理能力。

網感至察:網感認知雲如何實現人工智慧應用

網感至察:當知識圖譜遇到深度學習

3樓:星塵紀元

資料標註目前主要是人工標註和人機結合輔助標註兩種方法。如果資料量較小,可以採用人工標註的方法,但如果處理大量資料,人工的工作量會很大而且也不能保證效率和準確率。

目前,有一些大型人工智慧企業設立了自己的標註團隊,但由於這種方法較為費時、費力,為了節約人力成本,大多數人工智慧企業會考慮將這部分的工作外包給資料標註平台。讓專業的公司去做專業的事情,借助智慧型化輔助標註工具,不僅提公升了效率,而且實現了低成本高精度的標註。為各種場景提供可直接應用的AI訓練資料。

From:星塵資料 stardust

4樓:

找大量人工標註

合成資料(CGI)

合成資料再合成(參考蘋果S+U)

主動學習

合成資料(反向,假設反向問題比較簡單)

遷移學習

特別說下反向合成資料,比如訓練線稿上色網路,你可以先訓練個提取線稿的網路。這個問題上是比上色簡單的,然後那這個生成的資料結合修飾,再用來訓練需要的上色任務。

5樓:face-it

標註資料是不可避免的,但是可以考慮使用盡可能少的標註資料來達到同樣的模型效能。相關的研究領域有: active learning、semi-supervised learning、transfer learning.

6樓:五指山下

這的確是個很大的問題。如果不使用公共資料集,自己做資料集就得一張張標註。ImageNet資料集是亞馬遜僱傭幾萬人手工標註的AMT。對於工業應用代價太大了。

如果快速學習英語呢 尤其是單詞?

Brother Joe007 像掃瞄器那樣的效率去背單詞,是否滿足你的要求?可惜沒什麼卵用!如下 怎樣背單詞比較快啊?能夠真正記住?當然,語言學習也要講究方法才會有效率,看如下圖 這張圖能給我們什麼樣的啟示呢?看看第一級詞彙600個,覆蓋普通英語文章的83 前面4級詞彙2600個,覆蓋率達到95 我...

背誦對外語學習是否有意義?尤其是在學習初期

Besser曼 看個人學習習慣,對於我來說,背誦是必須的,初中開始養成的習慣。初中英語老師每兩天講一篇課文,每天早讀會檢查我們背誦前一天的課文,初中英語老師對我們很好,所以每個人都希望最早的拿著英語書去找她背誦,然後聽她誇我們,那時候我為了能第乙個去找她背誦,吃完晚飯會拿著英語書去操場背誦半小時,睡...

為什麼我覺得做什麼都沒興趣,尤其是學習,?

素錦之年 我想你身邊的人可能太善良了,所以讓你沒有受到外界的刺激。我第乙份工作,主管讓我有什麼不懂地就去問老一點的員工,我還真的傻乎乎地不懂就去問。結果人家直接丟我一句 你不會自已看資料啊,這麼簡單的東西還用問人,真不知道你這個大學是怎麼讀的?她不僅什麼都不教我,反而還奚落了我一翻。我說 主管不是讓...