準研,nlp 有哪些坑

時間 2022-01-17 07:47:50

1樓:Neanderthal

現在對話是大熱門。特別是解決diverse同時又coherent的問題。

2樓:SmoothNLP

標註資料少!!!

標註資料少!!!

標註資料少!!!

重要的事情說三遍! 除了像word2vec, bert 為代表的各種embedding, 當你剛入門的時候, 包括segment, postag, dependency parsing 等三大經典tasks 你會發現能用的資料集少之又少. 且, 尤其是DependencyParsing(依存句法分析) 對標註者的知識要求極高, 不是誰想標就標, 感受一下:

業內通用的ctb8.0 (Chinese Tree Bank) 光依存句法分析這塊的標註指南就寫了192頁, 詞性標註指南44頁, 切詞標註指南33頁. 也就是說, 剛成為一名NLP合格的標註員就需要熟讀250頁乾貨的語言學知識.

對比鄰居CV, 3歲以上的孩子可以區分人像, 6歲以上可以標註30+動物 ...

最後打個招聘帖:hr@http://smoothnlp.com

新加坡有哪些大學實驗室關注 NLP 和 IR 研究方向?

NoviScl 產出比較穩定的 NUS Ng Hwee Tou,Kan Min YenNTU Shafiq Joty,Sun AixinSUTD Lu Wei,Soujanya PoriaSMU Jiang Jing I2R Su Jian,Li Haizhou,Nancy Chen Alibaba...

考完研後,你發現了考研數學有哪些坑

乙隻牧月 其實,無論別人說了那些關於坑的文字,都不如學長學姐老師朋友的耳提面命,可能也不如自己踩一踩,所以與其在這裡問一下大家,我覺得更好的方式是跟著一位能夠及時回覆同學學習疑問和題目困惑,這樣你在向老師發過去這道題的時候,他會根據他的經驗給予你很多講解,在這個過程中,你就已經輕輕鬆鬆避開了很多的坑...

nlp有哪些值得完整實現一遍的演算法

Nicolas 磚 dnn 這個不用說了 cnn 業務中用 lstm gru 序列任務的基礎 attention 從bahdanau,luong開始 transformer gpt bert xlnet的基礎 karpathy大神的char rnn,包含了lstm,attention,beam se...