卡梅大學(xué)數(shù)據(jù)科學(xué)與統(tǒng)計(jì)專題項(xiàng)目簡介【2.22日截止招生】
2025-02-10 11:57:02項(xiàng)目基本信息

專業(yè)類別
理工

參加形式
線上
適合人群
適合人工智能、數(shù)據(jù)科學(xué)、統(tǒng)計(jì)學(xué)等專業(yè)等大學(xué)生以上人群。
導(dǎo)師介紹

Osman
卡內(nèi)基梅隆大學(xué)終身正教授
Osman導(dǎo)師現(xiàn)任是卡內(nèi)基梅隆大學(xué)(CMU)計(jì)算機(jī)科學(xué)學(xué)院的終身正教授。此前他是CMU CyLab的博士后研究員。2011年秋季,他還在亞利桑那州立大學(xué)擔(dān)任訪問博士后學(xué)者。導(dǎo)師于2011年獲得馬里蘭大學(xué)(University of Maryland at College Park, MD)的電氣和計(jì)算機(jī)工程博士學(xué)位。
項(xiàng)目背景
一個(gè)賭徒面前有N個(gè)賭博機(jī),事先他不知道每臺賭博機(jī)的真實(shí)盈利情況,他應(yīng)該如何根據(jù)機(jī)器的操作結(jié)果做出反應(yīng),來使自身的收益最大化呢?——這個(gè)假設(shè)便是著名的“多臂強(qiáng)盜”問題的名字來源。實(shí)際上在機(jī)器學(xué)習(xí)被應(yīng)用的領(lǐng)域當(dāng)中,時(shí)時(shí)刻刻也都存在著這樣的選擇與決策情景:一個(gè)品牌針對其商品有著多款廣告宣傳,但不知道每一個(gè)用戶對于每一種廣告的接受程度;在投資中我們可能會面臨多個(gè)項(xiàng)目,但并無法確認(rèn)每個(gè)項(xiàng)目的具體回報(bào)率;亦或是在線零售商如何在不完全了解需求信息的背景下進(jìn)行實(shí)時(shí)動(dòng)態(tài)定價(jià)……
項(xiàng)目大綱
一、卡梅大學(xué)數(shù)據(jù)科學(xué)與統(tǒng)計(jì)專業(yè)簡介
項(xiàng)目全稱:基于統(tǒng)計(jì)分析原理的不確定性過程決策分析:以如何利用算法在“多臂老虎機(jī)”游戲中取勝為例(大學(xué)組)
專業(yè)簡介:“多臂強(qiáng)盜”問題是概率論中的一個(gè)經(jīng)典問題,亦是深度強(qiáng)化學(xué)習(xí)中的重要模塊。人們針對解決此類不確定性序列決策問題,提出了“多臂強(qiáng)盜”算法框架(Multi-Armed Bandits,簡稱MAB,中文又譯作“多臂老虎機(jī)”)。近年來這一算法框架因優(yōu)異的性能和較少的反饋學(xué)習(xí)等優(yōu)點(diǎn),在推薦系統(tǒng)、信息檢索到醫(yī)療保健和金融投資等諸多應(yīng)用領(lǐng)域中受到了廣泛關(guān)注。本課題正是以此框架為核心內(nèi)容,學(xué)生將在參與的過程中深入了解算法的基礎(chǔ)模型及應(yīng)用,將認(rèn)識到被廣泛使用的上置信界算法(Upper Confidence Bound,簡稱UCB)及湯普森采樣算法(Thompson Sampling Algorithms)。導(dǎo)師還將講授自身在該領(lǐng)域的最新研究成果
適合年級 (Grade): 大學(xué)生及以上
適合專業(yè) (Major):人工智能、數(shù)據(jù)科學(xué)、統(tǒng)計(jì)學(xué)等專業(yè)學(xué)生
專業(yè)背景:學(xué)生需要具備微積分、概率論與數(shù)理統(tǒng)計(jì)基礎(chǔ),同時(shí)會使用Python編程語言,這里建議選修Python數(shù)據(jù)處理及其數(shù)學(xué)原理
二、卡梅大學(xué)數(shù)據(jù)科學(xué)與統(tǒng)計(jì)學(xué)專業(yè)項(xiàng)目時(shí)間
開始日期:2025-02-22
課時(shí)安排:7周在線小組科研學(xué)習(xí)+5周不限時(shí)論文指導(dǎo)學(xué)習(xí)
三、卡梅大學(xué)數(shù)據(jù)科學(xué)與統(tǒng)計(jì)學(xué)專題學(xué)習(xí)內(nèi)容
1、多臂老虎機(jī)問題的基礎(chǔ)介紹 Introduction to Multi-armed Bandits
2、隨機(jī)多臂老虎機(jī)模型 Stochastic Multi-armed Bandits
3、上置信界(UCB)算法 The Upper Confidence Bound (UCB) Algorithm
4、貝葉斯強(qiáng)盜策略與湯普森采樣算法 Bayesian Bandits and Thompson Sampling (TS)
5、算法應(yīng)用于實(shí)施,算法性能分析 Algorithm implementation, performance analysis
6、多臂老虎機(jī)算法在推薦系統(tǒng)中的應(yīng)用 Applications of Bandits in Recommendation Systems
7、學(xué)術(shù)研討1:教授與各組學(xué)生探討并評估個(gè)性化研究課題可行性,幫助學(xué)生明晰后續(xù)科研思路 Final Project Preparation Session I
8、學(xué)術(shù)研討2:學(xué)生將在本周課前完成程序設(shè)計(jì)原型(prototype)及偽代碼(Pseudocode),教授將根據(jù)各組進(jìn)度進(jìn)行個(gè)性化指導(dǎo),確保學(xué)生優(yōu)質(zhì)的終期課題產(chǎn)出 Final Project Preparation Session II
9、項(xiàng)目成果展示 Final Presentation
10、論文指導(dǎo) Project Deliverables Tutoring
課時(shí)安排
12周時(shí)間安排
報(bào)名方式

項(xiàng)目收獲
1、優(yōu)秀學(xué)員有機(jī)會獲得卡梅資深老師推薦信
2、加強(qiáng)數(shù)據(jù)科學(xué)與統(tǒng)計(jì)相關(guān)的基礎(chǔ)背景
3、為進(jìn)入世界名校奠定基礎(chǔ)
4、獲得項(xiàng)目結(jié)業(yè)證書
