深度學習——神經網路的基本介紹
開啟掘金成長之旅!這是我參與「掘金日新計劃 · 12 月更文挑戰」的第22天,點選檢視活動詳情 目錄
目標
1.知道神經網路的概念
2.知道什麼是神經元
3.知道什麼是單層網路
4.知道什麼是感知層
5.知道什麼是多層神經網路
6.知道啟用函式是什麼?有什麼作用?
7.理解神經網路的思想
1)知道神經網路的概念
人工神經網路(ANN)
簡稱神經網路或類神經網路是一種模仿生物的神經網路(動物的中樞神經,特別是大腦的結構和功能)的數學模型,用於對函式進行估計或近似
與其他機械學習方法一樣,神經網路已經被用於解決各種各樣的問題,例如機械視覺和語音識別這些問題都是很難被傳統基於規則的程式設計所解決
神經元的概念
在生物神經網路中每個神經元與其他神經元連線,當他興奮的時候,將會向相鄰的神經元傳送化學物質,從而改變這種神經元類的電位,如果神經元的電位超過一個閾值,那麼它就會被啟用起。向其他神經元傳送化學物質。
我們可以把這一種神經元按一定層次結構連線起來的叫做神經網路
2)M-P神經元模型
可見:一個神經元的功能就是求輸入向量與權向量的內積,經一個非線性傳遞函式得到一個標量結果
向量的內積概念 即 向量的的數量積 定義:兩個非零向量的夾角記為〈a,b〉,且〈a,b〉∈[1,π]。 定義:兩個向量的數量積(內積、點積)是一個數量,記作a·b。若a、b不共線,則a·b=|a|·|b|·cos〈a,b〉
3)單層神經網路
單層神經網路是最基本的神經元網路形式,由有限的神經元構成,所有神經元的輸入向量都是同一個向量,由於每一個神經元都會產生一個表面結果,所以單純神經元的輸出是一個向量,向量的維數等神經元的數目
4)感知機(相當於兩層神經網路)
感知機作用:
將一個N維的向量空間用一個超平面分割成兩部分,給定一個輸入向量,超平面可以判斷出這個向量位於超平面的人一邊得到輸入時正類或者反類,對於二維空間就是一條線,把一個平面分成兩個部分
5)多層神經網路
多層神經網路就是由單層神經網路進行疊加之後,得到的所形成的層的概念,常用的多層神經網路有如下結構:
輸入層:由眾多神經元,接受大量非線性輸入資訊,輸入資訊為輸入向量
輸出層:訊息在神經元連結中的 傳輸 分析 權重,形成輸出結果,輸出資訊稱為輸出向量
隱藏層: 簡稱隱層是由輸入層和輸出層之間眾多神經源和連結組成的各個層面引伸
可以有一層或者多層,隱身的結節,數目不變,但數量越多,神經網路的非線性越顯著,從而它的強勁性更顯著
如圖:
概率:全連線
當前一層和前一層每個神經元相互連線,我們成當前一層為全連線層
進行的是y=w^t x + b 操作
6)啟用函式
為什麼需要啟用函式
我們直接上例子:現在有一組資料,三角形和四邊形需要分類
首先我們可以根據感知機模型畫出一條線
但是我們明顯可以看出來圖上資料不可能用一條直線分開了,
這時候我們考慮再加一層感知機 公式如下:(我們不難發現這樣子還是一條直線的劃分)
不管加多少感知機都無法二分類 這個時候我們考慮到 啟用函式
啟用函式分類
線性啟用函式和非線性啟用函式
我個人理解為(直線和曲線)
但是貼吧上大佬們說
線性條件 f(x1+x2) = y1+y2
f(kx1) = ky1
啟用函式作用
1.增加非線性分割能力
2.提高穩定性
3.緩解梯度消失(先理解一下就🆗)
4.加速模型建構