十五分鐘簡介人工智慧,以聽懂為目的

語言: CN / TW / HK

theme: scrolls-light

我從事人工智慧相關的工作,有時候親朋好友就問我,你那個人工智慧到底是什麼玩意?我一般不做解釋,因為很難說清楚。

後來,我碰到一個做演講的朋友,他了解了我的困惑之後,他給我佈置了一個任務:用十五分鐘講完人工智慧,只有一個要求,必須讓你的受眾可以聽懂,哪怕只講一個1+1=2!

於是,我就試著列了一個提綱,如果大家不懂的話,請給我反饋。

一、什麼是人工智慧?

人工智慧,英文是Artificial Intelligence,縮寫是AI。我們經常聽到穿西裝的人說AI、AI的,有時候指的是這個人工智慧。如果,是穿嘻哈風的年輕人說AI,他們可能是說Adobe Illustrator。這是Adobe公司出的一款軟體,用於圖形設計,是PS(Adobe Photoshop)的兄弟產品,主要用於設計卡通形象,它的縮寫也叫AI。

因此,當有高階精英趾高氣揚地給你說AI的時候,你可以問他,你說的是Artificial Intelligence還是Adobe Illustrator。後面,他或許會老實一些。

今天,咱們說的是人工智慧這個AI。人工智慧是由美國人麥卡錫在1956年提出的。人工智慧的本質是讓機器能像人一樣思考和行動。它主要通過模擬、延伸和擴充套件人的智慧,從而形成一定的理論、方法、技術及應用的新技術科學。

概念就說這麼多,下面看看它能做什麼。

二、人工智慧的應用

人工智慧的應用領域很廣,比如代替人眼的影象領域、代替人嘴的語言領域。從它的應用來看,確實是要代替人類的。

2.1 影象領域

首先來看一個影象分類,它能認識一個影象是什麼。比如,認識下面這個圖是香蕉。

再看一個,這個叫目標檢測。相比於分類,它又更進了一步,它可以找出哪個位置有什麼物體。比如,紅框是蘋果,藍框是香蕉。

還可以更細緻,下面這個叫語義分割。它可以判斷出,哪一個畫素屬於什麼物體。

這有什麼用呢?炫技嗎?自動駕駛用它呀。路上的落葉、石頭、塑料袋,甚至是一個圖釘,都是需要識別出來,以便於分析能不能通過。

其實,我們生活中最為常見的還是目標檢測。

比如下面這張圖,工地入口處,檢測工人是否佩戴安全帽。

img_check1.GIF

前兩天,我作為某大賽評委,看到了一個大學生做的一個作品,很有意思。

img_check2.GIF

它可以檢測桃子是否成熟,是否有病蟲害,還可以驅趕鳥類。這個正好用於振興農業發展。

還有更常見的一個應用,那就是OCR識別。

下面這個可以把你的動作或者表情遷移到其他人身上(比如動漫人物)。

img_pose2.GIF

還有一個,我們也經常見,叫超解析度。它可以用於舊圖修復,能讓模糊的圖變清晰。

img_px.GIF

可以說,影象領域是人工智慧應用範圍最廣的領域(我就不說之一)。

我們看到,人工智慧確實起到了替代人工的作用。我們不妨把時間拉長,不知道大家還能不能回憶起來,原來每個停車場(包含路邊)裡,都有一個大爺,負責指揮停車,貼條計時,收費放行。現在,都被機器給取代了。

2.2 自然語言領域

除了影象領域,在自然語言領域,人工智慧的應用也比較廣泛。

自然語言處理(Natural Language Processing 簡稱NLP),翻譯成通俗的詞語就是:人話。它想讓機器可以聽懂人話,看懂人話,而且還能任意表達人話,不限於哪國話。總之,就是讓機器人看書、寫字、閒聊天,還能有所總結和感悟,就和我們人類一樣。

看下面這個圖。

nlp.GIF

這是機器人在自然語言處理方面的成果,這個叫問答系統

找來一篇文章,比如上面的例子,原文是:

TensorFlow是一個免費的開源軟體庫,用於跨一系列任務的資料流和可微分程式設計。它是一個符號數學庫,也用於機器學習應用程式,如神經網路。谷歌將其用於研究和生產。TensorFlow由谷歌大腦團隊開發,供谷歌內部使用。它於2015年11月9日在Apache License 2.0下發布。

那麼,當機器學完了這段話之後。你就可以向他提問了。

你問它:TensorFlow是什麼、什麼是TensorFlow?

因為它學過。它就會回答:TensorFlow是一個免費的開源軟體庫……

除此之外,你問它誰發明的TensorFlow?這個它也學過,原文中有。它會回答說,是谷歌大腦開發的。

如果你問它,ITF男孩長得帥不帥?它就智障了。因為沒學過。

你遇到的很多客服系統,不是AI技術不行,主要是沒有那麼多對話資料去學習。

除此之外,還有很多的應用。

|分類 |簡介 |應用場景| | --- | --- |--- | |文字分類 | 通過訓練對一段文字的進行分類 |情感分類、輿論監控、文學體裁分類等 | |智慧回覆 | 基於大量聊天訊息訓練,依據上下文的相關內容生成回覆建議 |智慧客服、聊天機器人、問答系統 | |語言翻譯 | 將一種語言的文字轉換為另一種語言,同時保持含義完整 | 英漢翻譯、中日翻譯、古文現代文翻譯 | |文字生成 | 基於大量文字訓練,輸出當前詞語之後最大概率出現的文字 | 輸入法聯想、文字自動補全、智慧對聯、自動寫原創文章 | |資訊提取 | 獲取明文公告,通過演算法提取關鍵資訊,輔助決策 |金融風控 |

2.3 更多領域

人工智慧的應用領域很多。

各項技術可以相互結合,比如谷歌Imagen搞了一個語言加影象的應用,叫文字影象合成。說白了就是:我說你畫。

我說:一個騎自行車的土狗,一個游泳的泰迪熊。然後,人工智慧就能畫出對應的圖。

img_dog.png

這是小意思,可以再發揮點兒想象力,比如我說:一個火龍果在大雪天,成為了跆拳道黑帶!

img_hlg.png

你以為這只是科研階段嗎?不是的。我寫自媒體,我是看在眼裡的。包括百度、頭條等平臺,已經上線了文章轉視訊的功能。只要有文字,就可以生成音訊,可以生成視訊,而且我就在使用。

img2video.png

但是,不管怎麼結合,萬變不離其宗,人工智慧是由一些基礎技術支撐的。

其他AI相關技術,都是通過使用這些基礎技術發展起來的。這幾個基礎技術如下:

  • 機器學習:人工智慧的核心,研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的效能。
  • 知識圖譜:用圖模型來描述知識和建模世界萬物之間關聯關係的技術方法。這是先決條件,只有建立了行業知識圖譜,才能給出行業AI方案。現在各家都在搞知識圖譜,但是很少有真正實用的。
  • 自然語言:能實現人與計算機之間用自然語言進行有效通訊的各種理論和方法。主要應用於機器翻譯、輿情監測、自動摘要、觀點提取、文字分類等。
  • 人機互動:為完成確定任務的人與計算機之間的資訊交換過程。例如:眼睛虹膜、眼動、掌紋、筆跡、步態、語音、脣讀、人臉、DNA等。
  • 語音識別:是利用機器將語音訊號轉換成文字資訊。
  • 影象視覺:用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等機器視覺,並進一步做圖形處理。

三、人工智慧的發展階段

人工智慧有三個發展階段:弱人工智慧、強人工智慧、超人工智慧。

當前的話,人工智慧還處於弱人工智慧階段。並且,這一階段將維持較長的時間。

那位說了,這孩子說話,老賣關子。你倒是說啥樣是強,啥樣是弱啊。

3.1 弱人工智慧

這是我們目前所處的階段,你看到的人工智慧,都是弱人工智慧。

它只會計算和推斷,只能解決某個具體問題。比如智慧推薦購物、機器人客服、識別哈士奇與狼、自動作畫、甚至戰勝柯潔的AlphaGo等。

3.2 強人工智慧

當走向強人工智慧時,機器人就擁有了意識,擁有和人類一樣的智慧水平。換句話說,你和它一起生活,你發覺不出它是個機器人。

3.3 超人工智慧

到了超人工智慧,它就會像人類一樣自己去學習。而且學習速度極快,幾秒鐘運算上億次,幾分鐘可以超過人類幾百年的積累,智慧水平會遠超過我們人類。

到時候,就不是我在這裡編文章了。我比它差多了。我腦子裡只有100本書,AI腦子裡有全人類的知識。

四、我對人工智慧的見解

4.1 人工智慧的機會

現在大廠的AI平臺太多了,還有必要自己做人工智慧嗎?個人還有機會嗎?

有機會呀。大廠平臺解決的是1000萬人市場規模中70%的問題。自研人工智慧可以解決垂直領域10萬人市場95%的問題。大與小的辯證一直都存在。海洋裡有大魚存在,不代表蝦米就會滅絕。

你在某一個極小的點上,做出超過大廠的效果,這在業內,真的一點也不奇怪。

4.2 人工智慧的門檻

人工智慧很難嗎?

寫到這個標題,估計有人預測我要賣課了,看著挺像,但並非如此。

做學術研究門檻確實高,但是做應用解決問題真的非常簡單。

人工智慧框架非常多,如果僅僅是做應用,瞭解了基本概念之後,幾行程式碼就可以解決很多問題。國家也有計劃在小學生中普及AI程式設計,可見它並不是很難。

4.3 人工智慧的瓶頸

弱人工智慧還要持續很長時間,限制人工智慧發展的因素是什麼?

業內普遍認為主要有3項:算力、演算法和資料。

算力主要指計算機硬體裝置。演算法主要指人工智慧的軟體支援。

資料指提供人工智慧分析和學習的素材。目前在資訊化很發達的今天,資料依然不足以支撐人工智慧實現質的飛越。主要原因是資料碎片化嚴重,各場景下的採集和歸納成本極高。

小資料僅僅能支撐小場景。比如自動駕駛,你搞一個你房間裡的自動駕駛其實很簡單,路線和物品基本都是固定的。你訓練好了模型,在你屋裡它可以自由走動,可以去次臥拿了物品放到主臥去。但是,你放到你們小區裡,就不行了。放到全國、全球,就更智障了。雖然說,人工智慧不是窮舉所有場景,但是代表性的樣本都來幾條不過分吧。僅僅這個數量級,現在也是無法收集到的。

以上就是我講的人工智慧。

大家好,我是ITF男孩,在掘金是@TF男孩,一個IT男。帶你從IT角度看世界。