在未來的產(chǎn)業(yè)布局中,云網(wǎng)融合、軟硬一體化,硬件智能化、軟件的泛化以及數(shù)據(jù)無處不在,基本是未來的趨勢。新一輪的信息科技基本都長在云上,未來大部分的科技也都在信息技術(shù)之上,這也是互聯(lián)網(wǎng)平臺最大的價值。當(dāng)前,我們已經(jīng)在智慧時代拐點,由巨大支撐的AI技術(shù)愈發(fā)成熟,強調(diào)計算能力在促進科技進步和社會發(fā)展中的重要價值和作用,強調(diào)算力變革改變未來人類生產(chǎn)和生活方式,成為賦能社會數(shù)智化轉(zhuǎn)型的基礎(chǔ)能源。
麥肯錫曾預(yù)測,到2030年全球有8億工作崗位被機器人(或AI)替代,一些崗位也將會發(fā)生重大變化。自動化和智能化對強管理屬性、強專業(yè)屬性和強溝通屬性影響較小。未來,用人需求將持續(xù)增長在醫(yī)療服務(wù)者、工程師、信息技術(shù)展業(yè)人員、管理者、教育工作者、創(chuàng)意工作者等人員中。各行各業(yè)都在加速著數(shù)字化,未來商業(yè)的語言似乎就是計算機程序,對自帶數(shù)字化基因的原生崗位需求也將迅速增長,具有“專業(yè)技能+數(shù)字化技能”復(fù)合型人才也將更具競爭力。
神經(jīng)網(wǎng)絡(luò)今天已經(jīng)變得非常流行,但仍然缺乏對它們的了解。一方面,我們已經(jīng)看到很多人無法識別各種類型的神經(jīng)網(wǎng)絡(luò)及其解決的問題,更不用說區(qū)分它們中的每一個了。其次,在某種程度上更糟糕的是,當(dāng)人們在談?wù)撊魏紊窠?jīng)網(wǎng)絡(luò)時不加區(qū)分地使用深度學(xué)習(xí)這個詞而沒有打破差異。
在處理大量數(shù)據(jù)時,有必要將具有特征的空間壓縮為向量。一個例子是文本嵌入,它是幾乎所有 NLP 模型創(chuàng)建過程中不可或缺的一部分。不幸的是,使用神經(jīng)網(wǎng)絡(luò)處理這種類型的數(shù)據(jù)遠非總是可能的——例如,原因可能是擬合或推理率低。
自從Vaswani 等人發(fā)表開創(chuàng)性論文“ Attention Is All You Need ”以來,transformer 模型已經(jīng)成為 NLP 技術(shù)中的最新技術(shù)。從 NER、文本分類、問答或文本生成等應(yīng)用,這項驚人技術(shù)的應(yīng)用是無限的。
NLP 技術(shù)最有用的應(yīng)用之一是從非結(jié)構(gòu)化文本(合同、財務(wù)文件、醫(yī)療記錄等)中提取信息,它支持自動數(shù)據(jù)查詢以獲得新的見解。傳統(tǒng)上,命名實體識別已被廣泛用于識別文本中的實體并存儲數(shù)據(jù)以進行高級查詢和過濾。
數(shù)據(jù)工程師和分析師對大量數(shù)據(jù)運行交互式臨時分析的需求繼續(xù)呈爆炸性增長。數(shù)據(jù)平臺團隊越來越多地使用聯(lián)合SQL 查詢引擎 PrestoDB 為各種用例運行此類分析,跨越廣泛的數(shù)據(jù)湖和數(shù)據(jù)庫就地,而無需移動數(shù)據(jù)。
本篇文章是我們學(xué)習(xí)Python及其在機器學(xué)習(xí)(ML)和人工智能(AI)的應(yīng)用系列中的最后一個模塊了,在上一個模塊中,我們學(xué)習(xí)Keras,討論了神經(jīng)網(wǎng)絡(luò)。下面,我們將要學(xué)習(xí) Numpy 和 TensorFlow,這兩個是學(xué)習(xí)機器學(xué)習(xí)的構(gòu)建塊,所以在使用機器學(xué)習(xí)的時候,你一定會接觸到它們。同時,還會簡要概述 scikit-learn 庫,因為它是Python中最完整的機器學(xué)習(xí)(不包括深度學(xué)習(xí))庫。