微軟 Azure Cloud Advocates 很高興提供一個為期 10 週、共 20 課的數據科學課程。每課都包含課前與課後小測驗、完整的書面操作說明、解答以及作業。我們採用專案導向的教學方法,讓您邊學邊做,這是讓新技能「真正記住」的有效方法。
衷心感謝我們的作者: Jasmine Greenaway、Dmitry Soshnikov、Nitya Narasimhan、Jalen McGee、Jen Looper、Maud Levy、Tiffany Souterre、Christopher Harrison。
🙏 特別感謝 🙏 我們的 Microsoft Student Ambassador 作者、審閱者及內容貢獻者, 尤其是 Aaryan Arora、Aditya Garg、Alondra Sanchez、Ankita Singh、Anupam Mishra、Arpita Das、ChhailBihari Dubey、Dibri Nsofor、Dishita Bhasin、Majd Safi、Max Blum、Miguel Correa、Mohamma Iftekher (Iftu) Ebne Jalal、Nawrin Tabassum、Raymond Wangsa Putra、Rohit Yadav、Samridhi Sharma、Sanya Sinha、Sheena Narula、Tauqeer Ahmad、Yogendrasingh Pawar、Vidushi Gupta、Jasleen Sondhi
![]() |
|---|
| 初學者數據科學 - 手繪筆記作者 @nitya |
Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Khmer | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese
喜歡本地克隆?
本倉庫包含 50 多種語言的翻譯,會大幅增加下載大小。若想不下載翻譯檔案,可以使用稀疏檢出:
Bash / macOS / Linux:
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'CMD (Windows):
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone "/*" "!translations" "!translated_images"這樣就能以更快速度下載所需的完整課程內容。
如果您想要更多翻譯語言的支援,請參考此連結 here
我們有持續進行的 Discord AI 學習系列,詳情及加入請至 Learn with AI Series,活動日期為 2025 年 9 月 18 日至 30 日。您將學習使用 GitHub Copilot 進行數據科學的秘訣與技巧。
開始使用以下資源:
- 學生中心頁面 這頁會有入門資源、學生軟體包,甚至是免費考證券的獲取方法。這是您想加入書籤並不時查看的一頁,因為我們至少每月會更換一次內容。
- Microsoft Learn Student Ambassadors 加入全球學生大使社群,這或許是您進入微軟的管道。
完全初學者:對數據科學陌生?從我們的入門範例開始!這些簡易且有良好註解的範例將幫助您理解基礎,再進一步學習完整的課程大綱。 學生:若想使用本課程自學,請 fork 整個倉庫並自行完成練習,從課前小測驗開始。接著閱讀講義並完成後續活動。努力理解課程內容並嘗試自行完成專案,而非直接複製解答代碼;不過解答在各專案導向課程的 /solutions 資料夾中皆可查閱。另一種做法是與朋友組成學習小組,共同研讀內容。若想進一步學習,我們推薦 Microsoft Learn。
快速開始:
- 查看安裝指南設置開發環境
- 複習使用指南了解如何操作課程內容
- 從第一課開始並依序學習
- 加入我們的Discord 社群尋求支援
Gif 製作 Mohit Jaisal
🎥 點擊上方圖片觀看關於本專案及創作者的影片!
我們在設計本課程時選擇了兩項教學原則:確保其以項目為基礎以及包含頻繁的測驗。在本系列結束時,學生將學習到資料科學的基本原理,包括倫理概念、資料準備、不同的資料操作方式、資料視覺化、資料分析、資料科學的實際應用案例等等。
此外,在課程前進行低壓力測驗,有助於學生設定學習主題的目標,而課程後的第二次測驗則確保進一步鞏固。此課程設計靈活有趣,可以整體或部分學習。項目起初較簡單,並在10週循環結束時逐漸變得較複雜。
- 選擇性的手繪筆記
- 選擇性補充影片
- 課前熱身測驗
- 書面課程內容
- 對於以項目為基礎的課程,提供逐步指導以完成項目
- 知識檢測
- 挑戰任務
- 補充閱讀資料
- 作業
- 課後測驗
關於測驗的小提醒:所有測驗均包含在 Quiz-App 資料夾中,總計40個測驗,每個三題。它們從課程中連結,但測驗應用可在本地執行或部署到 Azure;請參考
quiz-app資料夾中的教學。測驗正在逐步本地化中。
剛接觸資料科學? 我們製作了特別的範例目錄,包含簡單且註解詳盡的程式碼,助您起步:
- 🌟 Hello World - 您的第一個資料科學程式
- 📂 讀取資料 - 學習讀取與探索資料集
- 📊 簡單分析 - 計算統計並尋找模式
- 📈 基礎視覺化 - 製作統計圖表
- 🔬 實際專案 - 從頭到尾完成工作流程
每個範例均有詳細註解解說每步驟,非常適合初學者!
👉 從範例開始 👈
![]() |
|---|
| 初學者資料科學:路線圖 - 手繪筆記由 @nitya 製作 |
| 課程編號 | 主題 | 課程群組 | 學習目標 | 連結課程 | 作者 |
|---|---|---|---|---|---|
| 01 | 定義資料科學 | 介紹 | 了解資料科學背後的基本概念及其與人工智慧、機器學習和大數據的關聯。 | 課程 影片 | Dmitry |
| 02 | 資料科學倫理 | 介紹 | 資料倫理的概念、挑戰與框架。 | 課程 | Nitya |
| 03 | 定義資料 | 介紹 | 探討資料的分類及其常見來源。 | 課程 | Jasmine |
| 04 | 統計學與機率入門 | 介紹 | 使用機率與統計的數學技巧來理解資料。 | 課程 影片 | Dmitry |
| 05 | 使用關聯資料 | 資料操作 | 關聯資料介紹與使用結構化查詢語言(SQL,發音為「see-quell」)探索和分析關聯資料的基本知識。 | 課程 | Christopher |
| 06 | 使用非關聯資料 | 資料操作 | 介紹非關聯資料、各種類型及探索和分析文件資料庫的基本知識。 | 課程 | Jasmine |
| 07 | 使用 Python | 資料操作 | 使用 Python 及像 Pandas 這類函式庫進行資料探索的基礎。建議有 Python 程式基礎。 | 課程 影片 | Dmitry |
| 08 | 資料準備 | 資料操作 | 資料清理與轉換技術,處理遺漏、不準確或不完整資料的挑戰。 | 課程 | Jasmine |
| 09 | 數量視覺化 | 資料視覺化 | 學習如何使用 Matplotlib 來視覺化鳥類資料 🦆 | 課程 | Jen |
| 10 | 數據分佈視覺化 | 資料視覺化 | 視覺化區間內的觀察值與趨勢。 | 課程 | Jen |
| 11 | 比例視覺化 | 資料視覺化 | 視覺化離散與分群比例。 | 課程 | Jen |
| 12 | 關係視覺化 | 資料視覺化 | 視覺化資料集與變數間的連結和相關性。 | 課程 | Jen |
| 13 | 有意義的視覺化 | 資料視覺化 | 製作有效理解問題與洞察的圖像的技巧與指導。 | 課程 | Jen |
| 14 | 資料科學生命週期入門 | 生命週期 | 資料科學生命週期介紹,以及取得與擷取資料的第一步。 | 課程 | Jasmine |
| 15 | 分析階段 | 生命週期 | 資料科學生命週期中聚焦資料分析的階段。 | 課程 | Jasmine |
| 16 | 傳達階段 | 生命週期 | 資料科學生命週期中聚焦於以易懂方式傳達分析見解給決策者的階段。 | 課程 | Jalen |
| 17 | 雲端資料科學 | 雲端資料 | 探討雲端資料科學及其優勢的系列課程。 | 課程 | Tiffany 與 Maud |
| 18 | 雲端資料科學 | 雲端資料 | 使用低程式碼工具訓練模型。 | 課程 | Tiffany 與 Maud |
| 19 | 雲端資料科學 | 雲端資料 | 使用 Azure Machine Learning Studio 部署模型。 | 課程 | Tiffany 與 Maud |
| 20 | 實地資料科學 | 實地 | 實際世界中由資料科學推動的項目。 | 課程 | Nitya |
按照以下步驟在 Codespace 中開啟此範例:
- 點擊 Code 下拉選單並選取 Open with Codespaces 選項。
- 在窗格底部選擇 + New codespace。 更多資訊請參閱GitHub 文件。
使用您的本地機器和 VSCode 透過 VS Code Remote - Containers 擴展,按以下步驟在容器中開啟此倉庫:
- 若是首次使用開發容器,請確保系統符合快速入門文件中所述的先決條件(例如安裝 Docker)。
要使用此儲存庫,可以選擇在隔離的 Docker 卷中開啟此儲存庫:
注意:底層將使用 Remote-Containers: Clone Repository in Container Volume... 命令,將原始碼克隆到 Docker 卷內,而非本地檔案系統。卷是持久化容器資料的首選機制。
或是開啟本地克隆或下載的儲存庫版本:
- 將此儲存庫克隆到本地檔案系統。
- 按 F1,選擇 Remote-Containers: Open Folder in Container... 命令。
- 選擇已克隆的資料夾,等待容器啟動,然後開始使用。
您可使用 Docsify 離線執行此文件。先 fork 此儲存庫,於本地安裝 Docsify,然後在此儲存庫根目錄輸入 docsify serve。網站將於本地主機的 3000 埠口服務:localhost:3000。
注意,筆記本不會透過 Docsify 呈現,若需執行筆記本,請另外在 VS Code 以 Python 核心執行。
我們團隊亦提供其他課程!歡迎參考:
遇到問題? 請查看我們的疑難排解指南,獲取常見問題的解決方案。
如果您在構建 AI 應用時遇到困難或有任何問題,歡迎加入我們的學習者和經驗豐富的開發者社群,一起討論 MCP。這是個支持性的社區,歡迎提問並自由分享知識。
如果您在構建過程中有產品反饋或發現錯誤,請訪問:
免責聲明:
本文件係使用 AI 翻譯服務 Co-op Translator 進行翻譯。雖然我們力求準確,但請注意,自動翻譯可能包含錯誤或不準確之處。原始文件之原文版本應被視為權威來源。對於重要資訊,建議採用專業人工翻譯。我們不對因使用本翻譯而引起的任何誤解或誤釋承擔責任。



