投稿郵箱:wdwxtg@qq.com 論文發表QQ:329612706 微信:lianpu13
當前位置首頁資訊 文化 產業文化 文化科技
  • 正文內容

五年來人工智能出版物增長12.9% 中國貢獻居二最關注計算機視覺領域

閱讀:3201 次 作者: 來源:前瞻網 發布日期:2019-01-18 09:45:20
基本介紹:

       人工智能(AI)對人類日益增長的重要性和相關性是無可爭議的:例如,AI助手和建議越來越多地融入我們的日常生活中。但是,人工智能似乎沒有普遍認同的定義。我們的分類方法有助于理解一個結構不斷變化的領域。人工智能集群圍繞搜索和優化、模糊系統、自然語言處理和知識表示、計算機視覺、機器學習和概率推理、規劃和決策以及神經網絡等領域。

       雖然該領域跨越多個行業,并且可以從不同的角度來看,例如教學,研究,工業和媒體,但這些視角之間的詞匯似乎沒有什么重疊。工業傾向于強調算法,可能有效地獲得時間和人力。人工智能的社會相關性日益增加以及越來越多地使用算法引發的潛在道德問題反映了媒體中應用和道德主題的可見性,這使得AI對公眾更加迫切和直觀。有趣的是,道德關鍵詞在教學中的代表性也更高,可能是由于公眾利益和政府的一些授權,如在荷蘭。在人工智能研究中,道德關鍵詞目前尚未明確可見,這就提出了一個問題:人工智能研究人員是否會進行道德分析,這些討論是否在人工智能領域之外進行,或者是否完全在研究之外進行。這一觀察值得注意,因為人工智能中負責任的創新對于確保所有人的安全和公平結果至關重要。

       人工智能也成為國家競爭力的一個重要領域。近年來,隨著人工智能研究生態系統的不斷發展,一些國家和國際上的人工智能政策和策略相繼出臺。這通過各種傳播方式,包括出版物、預印本、會議、競賽和軟件,增加了科學產出。

       人工智能活動存在很大的區域差異。中國渴望在全球范圍內引領人工智能,并得到雄心勃勃的國家政策的支持。中國人工智能研究人員的凈人才增長也表明了一個有吸引力的研究環境。中國的人工智能專注于計算機視覺,沒有專門的自然語言處理和知識表示集群,包括語音識別,這可能是因為在中國,這類研究是由企業進行的,它們可能不會發表那么多科學文章。中國的人工智能研究增長快速但仍然相對較低的引用影響,這可能是區域(而非全球)影響的一個癥狀。這一點也很明顯,因為國際合作水平相對較低,研究的流動性也相對較低,產生的人工智能研究語料庫相對較小,但被高度引用。與許多其他研究領域一樣,合作是成功的關鍵,這一點在全球社交媒體上的討論越來越多,國際人工智能競賽的數量也越來越多。

       歐洲在本報告中被定義為歐盟44個國家和有資格獲得Horizon 2020資金的相關國家。它是人工智能學術產出的最大區域,在歐洲以外的國際合作水平較高且不斷提高,但似乎正在失去學術人工智能,特別是近年來。歐洲廣泛的人工智能研究反映了歐洲國家的多樣性,每個國家都有自己的議程和專業。歐洲AI研究的重點領域包括用于模式識別,模糊系統以及語音和人臉識別的遺傳編程。與其他地區相比,歐洲的深度學習研究似乎與其他子領域的聯系較少,歐洲的AI機器人似乎嵌入在機器學習集群中。

美國企業部門吸引人才,并且在人工智能研究方面表現強勁,這可能是由于他們的跨部門聯合實驗室傳統。在學術產出和人才保留方面,美國學術界也很強大。該國似乎在國際人工智能競賽中處于領先地位,美國研究人員越來越多地在國際人工智能研究方面進行合作。美國的AI專注于特定的算法,并將語音和圖像識別分成不同的聚類。該語料庫顯示的人工智能研究多樣性低于歐洲,但高于中國。

       在人工智能的其他主要貢獻者中,我們注意到印度的迅速崛起,按人工智能出版物計算,印度目前是僅次于中國和美國的第三大國家。伊朗在2017年的出版物產出中排名第九,與法國和加拿大等國持平。去年,俄羅斯的科研產出超過了新加坡和荷蘭,但仍落后于土耳其。德國和日本仍然是全球第五大和第六大人工智能研究產出國。

       人工智能研究的全球趨勢

       計算經同行評審的出版物是對研究成果的一種常見且易于理解的衡量標準。本報告旨在全面了解Scopus索引的所有類型的學術輸出,即期刊文章、會議論文和其他,如評論或調查論文。以下分析基于Scopus(2018年5月)1998年至2017年60多萬份人工智能出版物的精細化語料庫。此外,我們還研究了了預印本,會議和競賽。

       目前每年約有6萬篇論文發表。在全球范圍內,人工智能領域在過去5年里實現了12.9%的強勁增長。文學作品中有許多人工智能的歷史時間線,突出了該領域60年歷程中的關鍵事件和發現,包括“人工智能寒冬”,被理解為對該技術的幻滅期。例如,從2005年開始,神經網絡的研究開始在視覺和演講比賽中獲勝,到2009年,在一些基準測試中處于主導地位。2014-2015年前后,出現了多篇關于深度學習的優秀綜述(調查)論文。

       人工智能領域的發展可以看作是分四個階段發生的,每個階段五年,新經濟和互聯網大約在2000年左右出現,同時出現的還有今天的幾家企業,比如亞馬遜(Amazon)或谷歌。智庫歐亞集團(Eurasia Group)和Sinovation Ventures以及李開復確定了人工智能的四個領域:互聯網人工智能(推薦系統)、商業人工智能(欺詐檢測、財務預測)、感知人工智能(智能設備)和自主人工智能(自動駕駛汽車等新型硬件應用)。

       計算機視覺、神經網絡和機器學習系統的AI一般能力研究的增長,在共同發生集群的出版物(例如,文章和會議論文)的增長中也是顯而易見的,如圖3.2所示。這些研究領域似乎解釋了2012年之后出版物的急劇增長。從人工智能生態系統開始,我們看到圖形處理單元(GPU)的興起以及2012年ImageNet的推出,這是一個大型的開放式數據庫,它可能有助于推動這一發展。

       集群出版物數量的歷時發展并未顯示文章和會議論文之間的巨大差異。雖然“計算機視覺”領域似乎受益于“機器學習和概率推理”和“神經網絡”的發展,但“自然語言處理和知識表示”和其他能力受到的影響較小。

       在arXiv語料庫增長的背景下,12個核心人工智能學科領域的預印本占整個arXiv預印本數量的比例顯著增長。1998年,這12個類別總共只占149個預印本,占提交到arXiv存儲庫的所有預印本的0.62%。1998年至2014年,這一比例逐漸上升,2015年開始大幅上升;2017年,這12個類別的預印本占提交給arXiv的所有預印本的12%以上。

       查看12個核心AI主題類別提交的arXiv預印本,我們試圖發現提交模式的變化。隨著時間的推移,人工智能研究人員是否會根據每個學科類別提交的預印本數量,專注于不同類型的人工智能研究?圖3.3描述了隨著時間每個類別提交預印本的比例。

       對12個核心人工智能主題領域中任意一個的arXiv預印本的分析顯示,與這些主題相關的內容顯著增長,甚至與arXiv本身的增長相關。2017年,與核心人工智能概念相關的主題領域的預印本占全部arXiv內容的11.6%,到目前為止,占到2018年提交內容的15.1%——與幾年前(2015年為5.61%)相比,這是一個巨大的變化。這種增長可能是由于核心人工智能領域的關注、資金和研究的增加,但這也可能表明arXiv作為這些領域重要和可信的研究傳播工具的崛起,因為像谷歌DeepMind這樣的大型人工智能研究實驗室采用了這個平臺。

       在過去的20年里,研究重點可能已在核心人工智能領域內轉移。更傳統的是,計算語言學和自然語言處理研究在1998年主導了這些學科領域的arXiv提交(在所有12個類別中提交的149篇論文中有112篇,或75.2%)。雖然該領域仍然是人工智能研究領域的一個因素,但arXiv數據也表明計算機視覺和模式識別領域的顯著增長(從1998年核心AI提交的1.3%到2018年的32.7%,以及機器學習也增長明顯(1998年為1.3%,2018年為17.8%) - 這些領域都集中在深度學習應用技術。

       此外,像arXiv這樣的平臺似乎通過允許研究人員添加新的和更精確的主題區域名稱,來增加具體性,例如,區分機器學習中的統計學和計算機科學研究(始于2007年,2018年為10.8%)或添加主題類別(“計算機科學 - 聲音”在2004年增加,“音頻和語音處理”和“圖像和視頻處理”都在2017年添加)。

       arXiv預印本和Scopus出版物分析都根據平臺研究人員關注的領域,展示了AI領域的發展。雖然像“人工智能”這樣更通用的術語在arXiv上的提交率會隨著時間的推移而下降,但它們實際上是作為保護傘術語出現的。

       人工智能的區域研究趨勢——中國的崛起

       如圖3.4所示,歐洲仍然是人工智能研究的最大貢獻者,但其發表份額持續下降。美國正在收復過去五年失去的失地。中國在2004年就已經超過了美國,在不久的將來,中國人工智能的出版產出肯定會超過歐洲。

       圖3.5顯示其他個別國家在人工智能方面表現出強勁的發展。例如,印度在過去五年中成為人工智能研究的第三大國家。其他新興國家,如伊朗,也是人工智能研究的十大國家之一。像日本這樣的成熟研究國家在人工智能出版物產量方面也在增長,但其活力卻低于美國或中國。

       人工智能在應用領域的成功,如健康科學、移動性或農業,促進了人工智能研究的興趣和增長。本報告研究人工智能研究領域和集群中區域的專業化,并揭示了歐洲和美國醫學中AI應用的重點。

       近60%的人工智能研究出版物屬于自然科學,其增長速度也最快。其他領域,如農業科學,也表現出強勁增長,但基數較小(約2%)。圖3.6顯示了中國在農業科學中對人工智能很強的專業性,以及美國對醫學和健康科學的關注。歐洲和美國明顯強調人文科學,反映出出版物數量非常少,可能會受到語言的影響。

       關鍵詞共現的比較說明了每個地區的AI研究是如何專業化的,有助于識別共同的興趣和差異,例如共享的“模糊系統”群集,但是在“神經網絡”一詞下不同類型的研究有不同的集群。

       由于出版物總量較低,美國的集群結構較薄。與中國和歐洲受業界影響較大的集群“模糊系統”和“計算機視覺”相比,這一領域的差異較小。中國與歐洲和美國最明顯的區別是缺乏“自然語言處理和知識表示”集群。這可能是由于中國在該領域的出版量較低,因為該主題的研究可能是由當地公司(其發表的論文少于大學)推動的。在中國出版物中,“神經網絡”集群顯得非常不同,包括預測模型和反向傳播,以及機器人技術。在歐洲和美國,機器人技術是“機器學習和概率推理”集群的一部分。在中國和歐洲,我們針對“模式識別”等主題確定了“遺傳規劃”和“進化算法”的其他集群。通過分析每年的出版物和每個地區的共現集群,可以獲得有關區域專業化的更多詳細信息。

       中國明顯關注“計算機視覺”領域,近期增長非常迅速,并且其“模糊系統”的研究趨于平緩,這推動了中國在頭十年的出版增長。 “機器學習和概率推理”以及“搜索和優化”會影響所有子域,但“計算機視覺”尤其受益于這些領域的發展。 2009年的峰值是由于當時工程領域的會議的大力擴張。隨著神經網絡的興起,中國似乎從工程領域的研究主題,如“模糊系統”,轉向了其他領域。

       歐洲和美國顯示出類似的集群模式,“規劃和決策”和“計算機視覺”領域強烈推動了AI領域。來自歐洲的出版物更多地關注“規劃和決策”而不是“計算機視覺”?!吧窠浘W絡”研究在期刊文章方面迅速增長,但在所有地區的會議論文中則較少,而“自然語言處理和知識表示”的研究表明,各區域的會議論文增長強勁。

       除了語言的影響外,中美人工智能研究專業化的差異也可能源于不同的優先級;在中國,我們看到人工智能研究的重點是農業,而美國是健康問題。 “規劃和決策制定”適用于自動駕駛系統,強化學習,機器人,人機界面,計算機游戲和電影,物流和移動網絡。一個可能的解釋可以在歐洲和美國悠久的工業傳統中找到。

       AI會議一覽

       重要的人工智能會議,特別是他們對論文的呼吁,給出了當前人工智能研究趨勢的早期跡象。圖3.11的關鍵詞是從斯坦福AI指數推薦的2018年十大人工智能會議論文征集中手動提取的。對“學習”和“機器學習系統”的關注仍在繼續,但我們也看到了對多主題的濃厚興趣。

       如圖3.12所示,AI會議環境很復雜:會議在子域之間重疊,核心AI與數據挖掘領域之間有很強的聯系。人工智能會議還涉及相關領域,如數學,統計學,腦科學,機器人學,計算機圖形學,語言學,認知科學,社會科學,生物信息學,計算機系統或高性能計算。同樣,傳統的象征性人工智能會議使用“人工智能”一詞,而較新的人工智能會議使用機器學習和概率推理等術語,并/或與更獨立的應用程序會議相連接。

       我們使用數字書目和圖書館計劃(DBLP)計算機科學書目網站的數據,深入探討人工智能會議的歷時和區域趨勢。

       看一下非常狹窄的AI相關會議子集,其中包含142個核心AI關鍵詞,我們看到中國在過去二十年中再次見到會議論文最大幅度的增長。然而,這一增長與該地區同年幾年的會議論文總體增長沒有顯著差異。事實上,對于除美國以外的每個地區,其標題中具有核心AI術語的會議論文的增長率,低于DBLP跟蹤的會議論文總體增長率,而美國的差異并不顯著(見圖3.13)。

       如果與AI相關的學術活動數量越來越多,以其標題中具有核心AI關鍵詞的會議論文數量來衡量,則在DBLP審查的數據中并不明顯。然而,DBLP數據的多個問題,包括對某些計算機科學主題的不完整報道,使得無法得出明確的結論。為了更好地衡量該領域的研究活動,需要進一步研究以了解DBLP語料庫如何反映現實世界的會議研究活動,以及計算機科學的哪些領域在數據庫中具有更好的覆蓋率。

       在中國,企業部門的會議論文占所有出版物的比例較高,而政府部門的比例最低。在歐洲,企業部門在會議論文中所占比例僅略高,政府部門所占比例略低,但與中國相比差異不那么明顯。在美國,企業部門的會議論文比例一直較高。政府板塊的會議論文占比較高,近年來有所下降。

       在這些地區內,我們根據出版物數量和FWCI確定關鍵機構。這些信息應該放在整個區域產出和引用影響的背景下看待,以便深入了解一個區域的制度結構,即如果一個地區有幾個中等規模的人工智能貢獻者,那么與那些擁有大型集中研究機構的地區相比,這個地區的排名可能會更低。人工智能出版物產出的主要100個貢獻者占全球人工智能語料庫的41%(99000vs241000),占全球會議論文的32%(109000vs338000)。中國在前100名中脫穎而出,主要貢獻者超過三分之一(37),而美國(19)和歐洲(21)共同占三分之一,其余國家占據最后三分之一。這三個主要地區占全球人工智能出版物貢獻者的75%。圖3.17顯示了每個地區的一些主要貢獻者。美國不僅有兩個主要的企業貢獻者,而且美國微軟也是引用影響的杰出貢獻者。所有五大貢獻者的引用影響都比世界平均水平高三到五倍。歐洲由法國機構主導,其次是英國和西班牙的機構。法國和意大利擁有強大的國家政府研究組織CNRS和CNR。

       中國的其他主要貢獻者(按人工智能出版物的數量排序)是華中,北航,東北,東南,武漢,西安交通,大連,華南和西電的大學。在美國,以下大學也對全球人工智能研究機構作出了相當大的貢獻:南加州,佐治亞理工學院,伊利諾伊州厄巴納-香檳分校,伯克利分校,哈佛大學,馬里蘭州,華盛頓,德克薩斯州奧斯汀,密歇根大學,哥倫比亞。在歐洲,我們注意到以下大學是AI出版物的主要貢獻者:愛丁堡(英國),Leuven(比利時),Politecnica de Catalunya(西班牙),牛津(英國),倫敦大學學院(英國),Politecnica de Madrid (西班牙),曼徹斯特(英國),慕尼黑技術大學(德國),里斯本(葡萄牙)和代爾夫特(荷蘭)。其他地區如新加坡,伊朗,加拿大,臺灣,香港,日本和澳大利亞等在前100名中脫穎而出,每個地區都有兩個主要的貢獻機構。雖然它們不是一個關鍵區域,但它們可能是重要的參與者。與法國,英國或西班牙等同行相比,德國等其他國家的聯邦研究機構可能代表性不足。

       人工智能競賽的特例

       與學術界平齊或互補,競賽是傳播人工智能研究的另一個重要舞臺,也被用作招聘、培訓和協作的工具。為此,我們考察了Kaggle,這是一個主辦公共數據和機器學習競賽的領先平臺,也是一個由數據科學家和機器學習專家組成的動態社區。

       競賽獎勵的范圍從知識到聲望,再到經濟獎勵,因競賽類別而異。特色競賽通常有經濟獎勵,招聘競賽提供工作,研究競賽解決復雜問題,并有助于社區內的突破。例如,有一項競賽是為一種算法而舉辦的,該算法能夠在cern粒子碰撞中識別希格斯玻色子。這些競賽主要用作教育工具,反映了該領域的協作性質。然而,有經濟激勵的競賽在競賽中確實占了相當大的比例。工作機會占競賽報酬的1%,通常由硅谷的公司和公司提供。在Kaggle上提供的經濟獎勵差別很大,像在Kaggle上這樣的競賽,參賽人數不一定與提供的獎金數量相關。高額的經濟獎勵似乎會導致參與者數量的激增,但許多提供非經濟獎勵的競賽比提供工作或經濟獎勵的競賽提交的申請更多。

       看看按地區上傳數據集的組織,顯然Kaggle在很大程度上由美國主導,其1,041個數據集中有1,074個由美國境內的組織提供。這些數字并不反映個人上傳的數量,因為在上傳的9,572個數據集中,只有1,441個是由組織上傳的。圖3.18分析了Kaggle數據集,并提供了對社區的進一步見解,特別是顯示一些下載和查看最多的數據集與競賽無關,但其足夠強大,足以讓用戶不斷為他們的分析做出貢獻。

       2017年,Kaggle對其用戶進行了一項調查,以收集有關社區的信息,并收到了1.6%的Kaggle用戶的回復。大多數Kaggle用戶在亞洲、美國和歐洲。這三個地區約占用戶是70%,在美國超過四分之一。在歐洲,至少有400名來自英國、法國和德國的受訪者。這些國家在人工智能領域的主導地位反映在50位頂級用戶的分布上,其中10位來自法國,9位來自英國,6位來自德國。亞洲(不包括中國)也占調查受訪者的很大比例。印度占受訪者總數的16.8%,排名前150位的用戶占9.3%。在Kaggle調查中,只有3%的受訪者來自中國,前100名用戶中只有10名中國公民,其中40%居住在海外。中國用戶的缺乏可能與該國網站的相對模糊性有關,其中包括阿里巴巴天池網站,最新活動和天池競賽頁面以及DataCastle等競爭對手的本地網站數量龐大,注冊數量為75,208用戶。其他受歡迎的比賽由數據基金會,Kesci,中國計算機聯合會,Biendata,大數據研究中心,黑客數據,Soda等等舉辦。這可能表明中國更偏好國內比賽。

       AI知識轉移

       除研究出版物外,研究合作是地區、學科和部門之間學術交流和知識轉移的核心要素。合作已成為創新和卓越、跨越邊界、學科和社區的基石。低成本旅行、高速互聯網連接、移動技術、社交媒體、公眾參與和資助計劃推動了發展,鼓勵學者、社區和政策制定者將其網絡擴展到其直接的工作環境和傳統的影響范圍之外。

       人才從一個部門遷移到另一個部門是另一種知識轉移方式,特別是在新興領域。 LinkedIn Talent解決方案最近的一項研究顯示了學術界人才流向企業部門。另一方面,《衛報》和《金融時報》指出,學術界正面臨著研究人才的更高競爭。

       單一作者身份在所有地區都在下降,人工智能研究正在變得更加協作。歐洲和美國在國際上的合作越來越多。對于美國而言,這不僅帶來了出版物份額的擴大,也帶來了更高的引用影響。相比之下,歐洲的國際合作主要是出版物份額。中國正在減少其機構合作并轉向國家和國際合作。它的國際合作帶來了比美國和歐洲更大的引用影響。在三個地區的國際合作(圖3.21)的直接比較中,我們看到歐洲出版量的強勁增長,以及中國通過國際合作增加數量和引用影響的成功。

       超過90%的AI研究由學術部門制作。然而,通過代表兩個部門的作者的出版物來分析學術 - 企業合作,在知識轉移和創新方面發揮著關鍵作用??焖傺芯哭D移到應用程序是政府和創新計劃的關鍵目標,刺激經濟發展和創造就業機會。

       在全球所有領域內,學術 - 企業合作獲得更高的引用率,這也是每個地區開展的人工智能研究的情況(圖3.22)。這種跨部門合作在美國尤為突出,占其產量的近9%,其引用影響超過世界平均水平的三倍。這可以通過強大的美國AI公司來解釋,微軟和IBM等公司對人工智能的學術產出和影響做出了重大貢獻。中國的學術和企業出版物的全球平均份額低于3%,歐洲略高于3%,這兩個地區在這些合作中都獲得了類似的引文影響。

       除了研究合作之外,研究人員的流動性表明了知識交流 - 以及研究人員實際遷移到其他地區。圖3.23說明了每個區域的每個移動類的份額。


標簽:出版
注:本網發表的所有內容,均為原作者的觀點。凡本網轉載的文章、圖片、音頻、視頻等文件資料,版權歸版權所有人所有。
免费的中国黄网站大全