在自然科學領域,複雜的模型 如神經網路 在逐漸淘汰掉簡單的模型嗎?

時間 2021-06-02 08:23:06

1樓:QYUIOP

頭一次見到說力學模型簡單的。。

從牛頓開始到拉格朗日再到哈密頓都表示應該不是你說的這樣樣子。看一看入門的郎道的力學就明白了簡介的公式後邊所帶著對自然界深刻的理解。什麼是最小作用量~怎麼去完備的描述乙個力學系統。

到最後最後才是你看到的最簡潔的公式。至少我學了分析力學之後看到一些機器學習的優化迭代辦法覺得是自然而然的乙個事情~影象感很強。

所以,你看著簡單的模型,是因為前人在崇山峻嶺修了一條高速公路,不信的話你去看牛頓的原著,裡邊的描述特別的複雜。所以更重要的是去理解那些偉大的前人為啥能夠在複雜的世界中找出一條平坦的寬闊的路供後人馳騁。

2樓:

以我自己研究生期間做生物資訊的經驗來說,我是完全不贊同的。

科學上有乙個我很贊同的理論,是奧克姆剃刀理論,大意是「如無必要,勿增實體」,意思是能簡單就簡單,簡單的東西最棒了。

分析資料時,如果要找兩種狀態下的差異基因,那麼變化最明顯的,用最白痴的方法就能找出來。只有似有似無的差異,才需要絞盡腦汁的用各種更複雜的模型去發現。一般來說是為了強行配合實驗結果才會採取的策略吧。

我選擇模型的策略一向是,適合是第一位的,每一種模型都有適合的問題。像是神經網路或者所謂的深度學習,可能對現在的一些大資料分析很有用,但是對其他的問題,可能還沒有最簡單的模型效果好。

貝葉斯模型就是一種簡單,應用範圍廣的模型,我個人是很喜歡的。這些模型簡單又經典,普適性強,誰用誰知道,是不可能被淘汰的。

反而很多複雜模型,現在雖然很火,但是很多人用它僅僅是為了蹭熱度,不是因為真的適合。隨著時間的檢驗,這種殺雞用牛刀的行為不可能長久。複雜模型濫用的情況反而會越來越少。

3樓:格物Leon

並不是,複雜不是我們想要的,深刻的模型會代替粗淺的模型,自然科學畢竟是想去接近世界的本質。大資料擬合只是工程上的實現思路,原因在於沒法控制變數,搞不清楚底層,做科學的人還是要想著去解釋世界的。

4樓:Belleve

這麼說吧,模型有兩種,一種是基於經驗的,另一種就是所謂 ab initio「從頭的」。對蛋白質摺疊來說,前者是各種模型,包括你說的 ANN,還有分子力學;後者就是用量子力學從頭計算。前者越來越複雜是非常直白的事情,因為你要描述的物件(比如這裡的蛋白質摺疊)本身就很複雜。

而往往更簡潔後者不是我們不想用,而是它的方程變數太多,解不出來。

5樓:文刀叉點

機器學習建模不完全是黑盒,dirty更是談不上

其實模式識別裡有一大堆的工作最終都可以轉化為classification

但凡是在這個領域裡涉及到classification,無非就是representation+classification

也就是:描述(特徵)+分類

多數時候,幾乎是所有時候,特徵都是被表述為乙個高維向量的形式

以人類的思維極限,四維空間大家也基本很難去視覺化出來是個什麼模樣了(有點類似於星際穿越裡的xyz+t的那種形式,maybe)

更高維的更是呵呵了

那麼既然你連這種高維空間的構成概念都很難去理解,事實上還需要計算機去對這些樣本進行類別的分析。

那麼模型就不會是很簡單的,最簡單的一些聚類演算法比如k-means以及最簡單的距離度量比如歐氏距離

在不少時候其實已經不足以處理很多複雜的問題了。

所以這其實只是乙個自然而然的過程,是因為需要考慮到的問題實在是太多了

就說回到人類本身,大家覺得稀鬆平常的各種事情,其實任意拿乙個出來,在計算機學習的領域裡面都是處理起來非常之麻煩的

比如,一般人可以輕輕鬆鬆的識別某個人不同角度,比如你正面看、背面看、側面看,識別起來大多沒多少問題,但是在計算機視覺裡,這就依然有大量研究在進行著(person-re id)

其餘一些比如說你簡直不費吹灰之力就能知道乙個人的喜怒哀樂。這在計算機視覺理簡直是無比的困難,因為這是建立在要用大量的模型去模擬出相關的「屬性」,然後再用相應的屬性從訓練樣本裡構建特徵之後再訓練。但是結果又未必讓人滿意

+++++

反正我個人是覺得,在真正的AI出來之前,不要指望有什麼萬金油的工具能拳打四方了,就包括深度學習,也只是乙個過渡的東西

當然,未來真AI本身肯定就是乙個極其複雜的東西。

6樓:HashFury

這問題問的挺好,發表一下自己的看法:

1. 模型不存在誰淘汰誰的問題。模型可以理解為在一批觀察資料集上給出最好解釋的乙個數學公式,真理只有乙個,簡單和複雜都是客觀的,不存在誰被淘汰的問題

2. 真正的趨勢正好跟你所說的相反,是簡單的淘汰複雜的。

2.1 自然科學歷史上,一般都是簡單的模型來淘汰複雜的。原因呢?

從概率角度講,如果能解釋有限資料集的模型有N個,而模型是由很多結構和引數組合而成的,這樣的話簡單的模型數量一定是遠遠比複雜模型要少。如果乙個資料集命中了乙個簡單的模型,那說明這個簡單模型的置信度極高(好好理解一下嘍)。這也就是所謂的奧卡姆剃刀原理,即簡單的總是最好的。

這種例子縱觀整個物理學歷史,比比皆是。牛頓定律就是例子,能解釋力學關係資料的模型多的數不清,為啥只有簡單到不能再簡單的幾個公式才是被證明是最佳的。

2.2 我說的以上比較有通用性,神經網路這種黑箱肯定也是符合的。只有發現了乙個簡單的模型,才是真正值得驕傲的。

簡單模型的稀缺性就是最大價值!自然界的本質就是簡單的模型組合成複雜的模型。

7樓:Lala La

其實很多生物學資料都是不容易得到的,比如說讓你測乙個e coli細胞某一時刻所有rna,蛋白準確的量和細胞內分布,你就沒轍了,所以先紮實研究測量方法才是王道。回頭再琢磨大資料還是簡單模型。

8樓:

神經網路也不是越複雜越好

9樓:

生物模型的並不是由複雜對簡單進行替換,而是適應力強的對適應力弱的進行替換。

如果在當前情況下複雜模型更有生存優勢,那麼就是。反之,則不是。

現代自然科學的進展是不是在放緩?

山木今可否 在十七世紀,學完微積分就能做一定開創性工作了.而現在呢?知識總量的增長速度大大超過了人類壽命增長的速度,所以越往後,越多人究其一生也只能攀爬前人鑄就的高塔.不是學科本身難度的提高制約了基礎學科的突飛猛進. 舒自均 如何定義 放緩 舉個例子,你看見乙個人在以勻速吹氣球,單位時間吹進相同體積...

最近二十幾年,自然科學領域有哪些常識或理論得到了修正?

關注問題也有挺長時間了,來個材料方向的吧 金屬鋰基態真實結構被錯誤認知了70年!2017年,美國猶他大學Shanti Deemyad課題組在Science上發表了題為 Quantum and isotope effects in lithium metal 的文章,研究人員通過使用同步輻射X射線衍射...

自然科學的最後究竟是什麼?

東方朔 科學本身是發現規律和利用規律的過程,而人的宇宙環境固定,有些宇宙規律千載難逢,你根本不能觀察和研究,還有的因為材料的各種缺乏,造成技術斷層,比如給你聖人的感悟,你也不可能從鬥者直接變成鬥帝。人類能否發展到極致,還要看機緣 廣源 兩儀生四象,四象就是青龍自虎玄武朱雀,也帶表四季,春夏秋冬。四象...