Skip to content

Latest commit

 

History

History
262 lines (185 loc) · 25.4 KB

File metadata and controls

262 lines (185 loc) · 25.4 KB

初學者數據科學課程大綱

Open in GitHub Codespaces

GitHub license GitHub contributors GitHub issues GitHub pull-requests PRs Welcome

GitHub watchers GitHub forks GitHub stars

Microsoft Foundry Discord

Microsoft Foundry Developer Forum

微軟 Azure Cloud Advocates 很高興提供一個為期 10 週、共 20 課的數據科學課程。每課都包含課前與課後小測驗、完整的書面操作說明、解答以及作業。我們採用專案導向的教學方法,讓您邊學邊做,這是讓新技能「真正記住」的有效方法。

衷心感謝我們的作者: Jasmine GreenawayDmitry SoshnikovNitya NarasimhanJalen McGeeJen LooperMaud LevyTiffany SouterreChristopher Harrison

🙏 特別感謝 🙏 我們的 Microsoft Student Ambassador 作者、審閱者及內容貢獻者, 尤其是 Aaryan Arora、Aditya GargAlondra SanchezAnkita SinghAnupam MishraArpita Das、ChhailBihari Dubey、Dibri NsoforDishita BhasinMajd SafiMax BlumMiguel CorreaMohamma Iftekher (Iftu) Ebne JalalNawrin TabassumRaymond Wangsa PutraRohit Yadav、Samridhi Sharma、Sanya SinhaSheena NarulaTauqeer Ahmad、Yogendrasingh Pawar、Vidushi GuptaJasleen Sondhi

Sketchnote by @sketchthedocs https://sketchthedocs.dev
初學者數據科學 - 手繪筆記作者 @nitya

🌐 多語言支援

透過 GitHub Action 支援(自動且隨時更新)

Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Khmer | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese

喜歡本地克隆?

本倉庫包含 50 多種語言的翻譯,會大幅增加下載大小。若想不下載翻譯檔案,可以使用稀疏檢出:

Bash / macOS / Linux:

git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
cd Data-Science-For-Beginners
git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'

CMD (Windows):

git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
cd Data-Science-For-Beginners
git sparse-checkout set --no-cone "/*" "!translations" "!translated_images"

這樣就能以更快速度下載所需的完整課程內容。

如果您想要更多翻譯語言的支援,請參考此連結 here

加入我們的社群

Microsoft Foundry Discord

我們有持續進行的 Discord AI 學習系列,詳情及加入請至 Learn with AI Series,活動日期為 2025 年 9 月 18 日至 30 日。您將學習使用 GitHub Copilot 進行數據科學的秘訣與技巧。

Learn with AI series

你是學生嗎?

開始使用以下資源:

  • 學生中心頁面 這頁會有入門資源、學生軟體包,甚至是免費考證券的獲取方法。這是您想加入書籤並不時查看的一頁,因為我們至少每月會更換一次內容。
  • Microsoft Learn Student Ambassadors 加入全球學生大使社群,這或許是您進入微軟的管道。

開始使用

📚 文件

👨‍🎓 學生專區

完全初學者:對數據科學陌生?從我們的入門範例開始!這些簡易且有良好註解的範例將幫助您理解基礎,再進一步學習完整的課程大綱。 學生:若想使用本課程自學,請 fork 整個倉庫並自行完成練習,從課前小測驗開始。接著閱讀講義並完成後續活動。努力理解課程內容並嘗試自行完成專案,而非直接複製解答代碼;不過解答在各專案導向課程的 /solutions 資料夾中皆可查閱。另一種做法是與朋友組成學習小組,共同研讀內容。若想進一步學習,我們推薦 Microsoft Learn

快速開始:

  1. 查看安裝指南設置開發環境
  2. 複習使用指南了解如何操作課程內容
  3. 從第一課開始並依序學習
  4. 加入我們的Discord 社群尋求支援

👩‍🏫 教師專區

教師們:我們包含了一些建議來協助使用這套課程。非常期待您在討論論壇上的回饋!

認識團隊

宣傳影片

Gif 製作 Mohit Jaisal

🎥 點擊上方圖片觀看關於本專案及創作者的影片!

教學法

我們在設計本課程時選擇了兩項教學原則:確保其以項目為基礎以及包含頻繁的測驗。在本系列結束時,學生將學習到資料科學的基本原理,包括倫理概念、資料準備、不同的資料操作方式、資料視覺化、資料分析、資料科學的實際應用案例等等。

此外,在課程前進行低壓力測驗,有助於學生設定學習主題的目標,而課程後的第二次測驗則確保進一步鞏固。此課程設計靈活有趣,可以整體或部分學習。項目起初較簡單,並在10週循環結束時逐漸變得較複雜。

請參閱我們的行為守則貢獻指南翻譯指引。歡迎您提出建設性意見!

每節課包含:

  • 選擇性的手繪筆記
  • 選擇性補充影片
  • 課前熱身測驗
  • 書面課程內容
  • 對於以項目為基礎的課程,提供逐步指導以完成項目
  • 知識檢測
  • 挑戰任務
  • 補充閱讀資料
  • 作業
  • 課後測驗

關於測驗的小提醒:所有測驗均包含在 Quiz-App 資料夾中,總計40個測驗,每個三題。它們從課程中連結,但測驗應用可在本地執行或部署到 Azure;請參考 quiz-app 資料夾中的教學。測驗正在逐步本地化中。

🎓 新手友善範例

剛接觸資料科學? 我們製作了特別的範例目錄,包含簡單且註解詳盡的程式碼,助您起步:

  • 🌟 Hello World - 您的第一個資料科學程式
  • 📂 讀取資料 - 學習讀取與探索資料集
  • 📊 簡單分析 - 計算統計並尋找模式
  • 📈 基礎視覺化 - 製作統計圖表
  • 🔬 實際專案 - 從頭到尾完成工作流程

每個範例均有詳細註解解說每步驟,非常適合初學者!

👉 從範例開始 👈

課程列表

 由 @sketchthedocs 繪製的手繪筆記 https://sketchthedocs.dev
初學者資料科學:路線圖 - 手繪筆記由 @nitya 製作
課程編號 主題 課程群組 學習目標 連結課程 作者
01 定義資料科學 介紹 了解資料科學背後的基本概念及其與人工智慧、機器學習和大數據的關聯。 課程 影片 Dmitry
02 資料科學倫理 介紹 資料倫理的概念、挑戰與框架。 課程 Nitya
03 定義資料 介紹 探討資料的分類及其常見來源。 課程 Jasmine
04 統計學與機率入門 介紹 使用機率與統計的數學技巧來理解資料。 課程 影片 Dmitry
05 使用關聯資料 資料操作 關聯資料介紹與使用結構化查詢語言(SQL,發音為「see-quell」)探索和分析關聯資料的基本知識。 課程 Christopher
06 使用非關聯資料 資料操作 介紹非關聯資料、各種類型及探索和分析文件資料庫的基本知識。 課程 Jasmine
07 使用 Python 資料操作 使用 Python 及像 Pandas 這類函式庫進行資料探索的基礎。建議有 Python 程式基礎。 課程 影片 Dmitry
08 資料準備 資料操作 資料清理與轉換技術,處理遺漏、不準確或不完整資料的挑戰。 課程 Jasmine
09 數量視覺化 資料視覺化 學習如何使用 Matplotlib 來視覺化鳥類資料 🦆 課程 Jen
10 數據分佈視覺化 資料視覺化 視覺化區間內的觀察值與趨勢。 課程 Jen
11 比例視覺化 資料視覺化 視覺化離散與分群比例。 課程 Jen
12 關係視覺化 資料視覺化 視覺化資料集與變數間的連結和相關性。 課程 Jen
13 有意義的視覺化 資料視覺化 製作有效理解問題與洞察的圖像的技巧與指導。 課程 Jen
14 資料科學生命週期入門 生命週期 資料科學生命週期介紹,以及取得與擷取資料的第一步。 課程 Jasmine
15 分析階段 生命週期 資料科學生命週期中聚焦資料分析的階段。 課程 Jasmine
16 傳達階段 生命週期 資料科學生命週期中聚焦於以易懂方式傳達分析見解給決策者的階段。 課程 Jalen
17 雲端資料科學 雲端資料 探討雲端資料科學及其優勢的系列課程。 課程 TiffanyMaud
18 雲端資料科學 雲端資料 使用低程式碼工具訓練模型。 課程 TiffanyMaud
19 雲端資料科學 雲端資料 使用 Azure Machine Learning Studio 部署模型。 課程 TiffanyMaud
20 實地資料科學 實地 實際世界中由資料科學推動的項目。 課程 Nitya

GitHub Codespaces

按照以下步驟在 Codespace 中開啟此範例:

  1. 點擊 Code 下拉選單並選取 Open with Codespaces 選項。
  2. 在窗格底部選擇 + New codespace。 更多資訊請參閱GitHub 文件

VSCode 遠端 - 容器

使用您的本地機器和 VSCode 透過 VS Code Remote - Containers 擴展,按以下步驟在容器中開啟此倉庫:

  1. 若是首次使用開發容器,請確保系統符合快速入門文件中所述的先決條件(例如安裝 Docker)。

要使用此儲存庫,可以選擇在隔離的 Docker 卷中開啟此儲存庫:

注意:底層將使用 Remote-Containers: Clone Repository in Container Volume... 命令,將原始碼克隆到 Docker 卷內,而非本地檔案系統。是持久化容器資料的首選機制。

或是開啟本地克隆或下載的儲存庫版本:

  • 將此儲存庫克隆到本地檔案系統。
  • 按 F1,選擇 Remote-Containers: Open Folder in Container... 命令。
  • 選擇已克隆的資料夾,等待容器啟動,然後開始使用。

離線存取

您可使用 Docsify 離線執行此文件。先 fork 此儲存庫,於本地安裝 Docsify,然後在此儲存庫根目錄輸入 docsify serve。網站將於本地主機的 3000 埠口服務:localhost:3000

注意,筆記本不會透過 Docsify 呈現,若需執行筆記本,請另外在 VS Code 以 Python 核心執行。

其他課程

我們團隊亦提供其他課程!歡迎參考:

LangChain

LangChain4j for Beginners LangChain.js for Beginners LangChain for Beginners

Azure / Edge / MCP / Agents

AZD for Beginners Edge AI for Beginners MCP for Beginners AI Agents for Beginners


生成式 AI 系列

Generative AI for Beginners Generative AI (.NET) Generative AI (Java) Generative AI (JavaScript)


核心學習

ML for Beginners Data Science for Beginners AI for Beginners Cybersecurity for Beginners Web Dev for Beginners IoT for Beginners XR Development for Beginners


Copilot 系列

Copilot for AI Paired Programming Copilot for C#/.NET Copilot Adventure

獲取幫助

遇到問題? 請查看我們的疑難排解指南,獲取常見問題的解決方案。

如果您在構建 AI 應用時遇到困難或有任何問題,歡迎加入我們的學習者和經驗豐富的開發者社群,一起討論 MCP。這是個支持性的社區,歡迎提問並自由分享知識。

Microsoft Foundry Discord

如果您在構建過程中有產品反饋或發現錯誤,請訪問:

Microsoft Foundry Developer Forum


免責聲明
本文件係使用 AI 翻譯服務 Co-op Translator 進行翻譯。雖然我們力求準確,但請注意,自動翻譯可能包含錯誤或不準確之處。原始文件之原文版本應被視為權威來源。對於重要資訊,建議採用專業人工翻譯。我們不對因使用本翻譯而引起的任何誤解或誤釋承擔責任。