微軟 Azure 雲端推廣者很高興提供一個為期 10 週、共 20 節課的資料科學課程。每個課程包含課前與課後測驗、完成授課內容的書面指導、解答以及作業。我們以專案為導向的教學法讓你在實作中學習,這是讓新技能穩固成形的有效方式。
衷心感謝我們的作者: Jasmine Greenaway、Dmitry Soshnikov、Nitya Narasimhan、Jalen McGee、Jen Looper、Maud Levy、Tiffany Souterre、Christopher Harrison。
🙏 特別感謝 🙏 我們的 Microsoft 學生大使 作者、審閱者與內容貢獻者, 特別是 Aaryan Arora、Aditya Garg、Alondra Sanchez、Ankita Singh、Anupam Mishra、Arpita Das、ChhailBihari Dubey、Dibri Nsofor、Dishita Bhasin、Majd Safi、Max Blum、Miguel Correa、Mohamma Iftekher (Iftu) Ebne Jalal、Nawrin Tabassum、Raymond Wangsa Putra、Rohit Yadav、Samridhi Sharma、Sanya Sinha、 Sheena Narula、Tauqeer Ahmad、Yogendrasingh Pawar 、Vidushi Gupta、Jasleen Sondhi
![]() |
|---|
| 初學者資料科學 — 速寫筆記由 @nitya 製作 |
Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Khmer | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese
偏好本地複製?
本存放庫包含超過 50 種語言翻譯,會大幅增加下載大小。如欲不含翻譯內容之複製,請使用稀疏結帳:
Bash / macOS / Linux:
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'CMD (Windows):
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone "/*" "!translations" "!translated_images"這樣能讓您快速下載完成課程所需內容。
若您希望支援更多翻譯語言,請參考此處
我們正在舉辦 Discord AI 學習系列活動,了解更多並於 2025 年 9 月 18 日至 30 日加入我們:Learn with AI Series。您將獲得使用 GitHub Copilot 進行資料科學的技巧與秘訣。
請從以下資源開始:
- 學生中心頁面 這個頁面包含初學者資源、學生套件,甚至還有獲取免費認證憑證券的方式。這是您想要加入書籤並定期查看的頁面,我們會每月至少更新一次內容。
- Microsoft Learn 學生大使 加入全球學生大使社群,這或許是您進入微軟的途徑。
完全初學者:剛接觸資料科學?請先試試我們的入門友善範例!這些簡單且有詳盡註解的範例將幫助您理解基礎,再深入完整課程。 學生專區:欲自行使用本課程,請 fork 整個存放庫並自我完成練習,從課前測驗開始。接著閱讀授課內容並完成其餘活動。建議試著根據學到的知識自行完成專案,而非直接複製解答程式碼;不過每個以專案為導向的課程中,/solutions 目錄裡仍提供程式碼可供參考。另一想法是組成讀書會與朋友一同學習。更多進階學習建議參考 Microsoft Learn。
快速入門:
- 查看 安裝指南 以設置您的環境
- 閱讀 使用指南 了解如何使用課程內容
- 從第 1 課開始,按順序完成
- 加入我們的 Discord 社群 獲得支援
動畫 GIF 製作者 Mohit Jaisal
🎥 點擊上方圖片,觀看關於此專案與創建團隊的影片!
我們在設計這套課程時,選擇了兩個教學原則:確保課程以專案為基礎並且包含頻繁的測驗。透過這系列課程結束後,學生將學會資料科學的基本原理,包括倫理概念、資料準備、不同的資料處理方式、資料視覺化、資料分析、資料科學的實務案例等等。
此外,課前的低壓測驗設定學生學習某主題的意向,而課後的第二次測驗則有助於加強記憶。此課程設計靈活且有趣,學生可以全程修習或選擇部份學習。專案由淺入深,整個 10 週學期結束時會越來越複雜。
- 選修手繪筆記
- 選修補充影片
- 課前熱身測驗
- 書面課程內容
- 對於專案型課程,提供逐步建立專案的指引
- 知識檢核
- 挑戰任務
- 補充閱讀材料
- 作業
- 課後測驗
關於測驗的說明:所有測驗皆集中在 Quiz-App 資料夾中,共包含 40 個,每個測驗有三個問題。這些測驗會從課程中鏈結取得,但您也可以在本地端執行測驗應用,或部署至 Azure,請遵循
quiz-app資料夾中的指示。測驗也逐步進行在地化。
剛接觸資料科學嗎? 我們建立了一個特別的範例目錄,提供簡單且註解詳盡的程式碼,幫助您開始學習:
- 🌟 Hello World - 您的第一個資料科學程式
- 📂 讀取資料 - 學習如何讀取及探索資料集
- 📊 簡單分析 - 計算統計數據並發現模式
- 📈 基礎視覺化 - 建立圖表與折線圖
- 🔬 真實專案 - 完整的工作流程範例
每個範例都包含詳細註解,解釋每一個步驟,非常適合初學者!
👉 從範例開始 👈
![]() |
|---|
| 初學者資料科學:學習路線圖 - 手繪筆記作者 @nitya |
| 課程號碼 | 主題 | 課程組別 | 學習目標 | 關聯課程 | 作者 |
|---|---|---|---|---|---|
| 01 | 定義資料科學 | 介紹 | 理解資料科學的基本概念,以及它與人工智慧、機器學習和大數據的關係。 | 課程 影片 | Dmitry |
| 02 | 資料科學倫理 | 介紹 | 資料倫理的概念、挑戰與架構。 | 課程 | Nitya |
| 03 | 定義資料 | 介紹 | 資料的分類與常見來源。 | 課程 | Jasmine |
| 04 | 統計學與機率入門 | 介紹 | 利用機率與統計的數學技術來了解資料。 | 課程 影片 | Dmitry |
| 05 | 操作關聯資料 | 資料操作 | 關聯資料介紹,與使用結構化查詢語言(SQL,讀作「see-quell」)探索和分析關聯資料基礎。 | 課程 | Christopher |
| 06 | 操作 NoSQL 資料 | 資料操作 | 非關聯資料介紹,及其多種型態與使用文件資料庫進行探索及分析基礎。 | 課程 | Jasmine |
| 07 | 使用 Python | 資料操作 | 使用 Python 及 Pandas 等函式庫進行資料探索的基礎。建議有 Python 程式設計的基礎。 | 課程 影片 | Dmitry |
| 08 | 資料準備 | 資料操作 | 清理與轉換資料的技術,解決缺失、錯誤或不完整資料的挑戰。 | 課程 | Jasmine |
| 09 | 量的視覺化 | 資料視覺化 | 使用 Matplotlib 來視覺化鳥類資料 🦆 | 課程 | Jen |
| 10 | 資料分布的視覺化 | 資料視覺化 | 在區間內視覺化觀察值與趨勢。 | 課程 | Jen |
| 11 | 比例的視覺化 | 資料視覺化 | 視覺化離散和分組百分比。 | 課程 | Jen |
| 12 | 關係的視覺化 | 資料視覺化 | 視覺化資料集及其變數之間的連結和相關性。 | 課程 | Jen |
| 13 | 有意義的視覺化 | 資料視覺化 | 製作有效解決問題和洞察的視覺化技巧和指導。 | 課程 | Jen |
| 14 | 資料科學生命週期介紹 | 生命週期 | 介紹資料科學生命週期及其第一步驟——取得與萃取資料。 | 課程 | Jasmine |
| 15 | 分析 | 生命週期 | 著重於資料科學生命週期中分析資料的技巧。 | 課程 | Jasmine |
| 16 | 溝通 | 生命週期 | 著重於用讓決策者更容易理解的方式呈現資料洞察。 | 課程 | Jalen |
| 17 | 雲端資料科學 | 雲端資料 | 介紹雲端資料科學及其好處的一系列課程。 | 課程 | Tiffany 與 Maud |
| 18 | 雲端資料科學 | 雲端資料 | 使用低程式碼工具訓練模型。 | 課程 | Tiffany 與 Maud |
| 19 | 雲端資料科學 | 雲端資料 | 使用 Azure Machine Learning Studio 部署模型。 | 課程 | Tiffany 與 Maud |
| 20 | 資料科學實務 | 實務應用 | 真實世界中資料科學驅動的專案。 | 課程 | Nitya |
請依下列步驟在 Codespace 中打開此範例:
- 點選 Code 下拉選單,選擇 Open with Codespaces 選項。
- 在窗格底部選擇 + New codespace。 更多資訊請參考GitHub 文件。
請依下列步驟使用本機和 VSCode 與 VS Code Remote - Containers 擴充功能,於容器中開啟本儲存庫:
- 若您是第一次使用開發容器,請確認您系統符合先決條件(例如已安裝 Docker),可參考快速入門文件。
使用此儲存庫,可以透過隔離的 Docker 容器卷打開儲存庫:
注意:底層會使用 Remote-Containers: Clone Repository in Container Volume... 指令,將原始碼克隆到 Docker 容器卷中,而非本機檔案系統。Volumes 是持久化容器資料的推薦方法。
或打開本機已克隆或下載的儲存庫版本:
- 將此儲存庫克隆至本機檔案系統。
- 按下 F1、選擇 Remote-Containers: Open Folder in Container... 指令。
- 選擇克隆的資料夾,等待容器啟動,即可開始使用。
您可以透過使用 Docsify 離線瀏覽本文件。請分叉此儲存庫,於本機安裝 Docsify,然後在此儲存庫根目錄執行 docsify serve。網站會在本地端 3000 埠口提供服務:localhost:3000。
注意,Notebook 內容無法透過 Docsify 渲染,需另行在 VS Code 裡使用 Python 核心執行。
我們團隊也推出其他課程!請參考:
遇到問題? 請查看我們的疑難排解指南以尋找常見問題的解決方法。
如果您卡住了或者對建立 AI 應用程式有任何疑問,歡迎加入學習者及資深開發者的討論社群。這是一個支持彼此的社區,歡迎提問並自由分享知識。
如果您在產品使用過程中有任何反饋或錯誤,請訪問:
免責聲明: 本文件由 AI 翻譯服務 Co-op Translator 進行翻譯。雖然我們力求準確,但請注意,自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應被視為權威來源。對於重要資訊,建議採用專業人工翻譯。我們不對因使用本翻譯所產生的任何誤解或誤譯負責。



