營地地點:北京外國語大學國際會議中心
開始日期: 2024-01-12
課時安排: 2周專業預修與在線科研+10天面授科研+5周在線論文指導
適合人群
適合年級 (Grade): 大學生及以上
適合專業 (Major): 計算機科學、人工智能、軟件工程、語言學等專業或者希望修讀相關專業的學生;
學生需要具備初等線性代數基礎,至少會使用一門編程語言實現如貝葉斯分類器等經典機器學習算法,有深度學習項目開發經驗的申請者優先
導師介紹
Pavlos
哈佛大學 Harvard University項目主任
Pavlos導師現任哈佛大學應用計算科學研究所(IACS)項目主任,負責把控計算機科學、工程與數據科學專業的研究生培養方案與課程體系,教授數據科學核心課程。曾擔任國家可擴展集群項目(NSCP)的副主任,這是在網格模型上進行大規模分布式計算的最初嘗試之一。同時,在哈佛 - 史密松天體物理中心擔任過研究員,并擔任由哈佛大學創新計算項目啟動的“時間序列中心”的子項目的高級科學家、項目負責人。Pavlos is the Scientific Program Director at the Institute for Applied Computational Science at the Harvard John A. Paulson School of Engineering and Applied Sciences. As Scientific Program Director, he directs the educational program of the institute, overseeing the curriculum of the master’s programs in computational science and engineering and data science, teaching core data science courses, and mentoring master’s students and advising Ph.D. students in related fields. His research topics include many areas of machine learning and data science, especially classification, probabilistic graphical modeling, and time series analysis. From 2005 to 2013, he was at the Harvard-Smithsonian Center for Astrophysics. Previously, he was the associate director of the National Scalable Cluster Project, initiating one of the first ever attempts of using large-scale distributed computing on a grid-like model.
任職學校
哈佛大學(Harvard University)始建于1636年,是一所享譽世界的私立研究型大學,也是常春藤盟校成員。哈佛大學在學術界享有崇高的地位,并且在世界范圍內具有廣泛的社會影響力。哈佛大學孕育了8位美國總統,158位諾貝爾獎獲得者(世界第一)和18位菲爾茲獎得主(世界第一),在2019/2020年U.S.News世界大學排名中位列第一,2018年QS世界大學計算機科學以及電子工程專業排名位列第六。
項目背景
“You are what you say.”語言是思維的表達,思維是語言的內容。思維和語言是人類意識的集中體現,更是人與機器的分野。長久以來,人工智能依然停留在“弱人工智能”的階段,無法等同于人類智能,核心原因在于算法無法幫助機器“理解語義邏輯”。也就是說,“人工智能如果不能使用自然語言作為知識的表示基礎,人工智能就實現不了實質的跨越?!币虼?,旨在讓機器以有價值的方式閱讀、解密和理解人類語言,實現人機互動的自然語言處理,是人工智能、機器學習的核心研究對象,具有重要的行研價值和廣闊的發展空間。自然語言處理科學家更是高精尖科技企業爭相搶奪的對象。自然語言處理的具體應用包括谷歌語音識別、科大訊飛自動翻譯、百度自然語言處理平臺等等。
項目介紹
項目內容包括線性回歸、邏輯回歸、決策樹、SVM機器學習算法和自然語言處理中的文本分類問題。學生將深入探究Word2Vec詞向量嵌入、Doc2Vec文本向量生成、基于LSTM和其他RNN的分類算法,了解RNN模型缺陷以及基于Attention的Transformer語言模型如何彌補這些缺陷。學生將在項目結束時,提交個性化研究課題項目報告,進行成果展示。
個性化研究課題參考:
基于雙向LSTM語言模型的多義詞消歧
根據推文內容語義與語言習慣分析判斷用戶所在城市
發表基于NLP的微博內容調查報告
評估句子片段幽默程度的自注意力算法優化
In this course, you will be taken from basic topics of neural networks to advanced topics such as auto-encoders and transfer learning. We will review the topics covered in [AI-1], feedforward networks, gradient descent etc and then dive into convolutional neural networks, transfer learning, and auto-encoders.
項目大綱
自然語言處理及深度神經網絡 Introduction to Language Modeling and DNN
Word2Vec模型詞嵌入 Word embeddings using the Word2Vec model
Doc2Vec: 文檔的向量化表示 Doc2Vec: vectorized representation of documents
數據驅動的分類算法與循環神經網絡和長短期記憶網絡 Data-driven classification algorithms; recurrent neural networks and LSTM
循環神經網絡的缺陷;基于Attention的Transformer模型 Drawbacks of RNNs; attention-based transformers
精度優化 SOTA
基于遷移學習的語言模型Transfer Learning for Language Models
項目回顧與成果展示 Program Review and Presentation
論文輔導 Project Deliverables Tutoring
項目收獲
2周專業預修與在線科研+10天面授科研+5周不限時在線論文指導
項目報告
優秀學員獲主導師Reference Letter
EI/CPCI/Scopus/ProQuest/Crossref/EBSCO或同等級別索引國際會議全文投遞與發表指導(可用于申請)
結業證書
成績單
留學也是一種投資,你的留學預算充足嗎,簡單3步,輕松了解留學預算?
費用計算
版權及免責聲明:
1、如轉載本網原創文章,請務必注明出處:寰興留學(www.88891111a.com);
2、本網轉載媒體稿件、圖片旨在傳播更多有益信息,并不代表同意該觀點,本網不承擔稿件侵權行為的連帶責任;如轉載稿、圖片涉及版權等問題,請作者在兩周內速來電或來函聯系,我們將立即刪除。