
在這個人工智能時代,Markdown因其易用性而備受重視。這種標記語言易於人類和機器理解。此外,與 HTML 和 DOCX 相比,這種格式更有助於法學碩士 (LLM) 理解文檔結構。因此,本指南將介紹如何以 Python 編程方式將HTML轉換為 Markdown。我們將使用Aspose.HTML for Python via .NET,因為它易於在 Python 項目中設置。這款 Python 軟件開發工具包提供企業級功能,可自動化網頁轉換和操作。
加入Aspose技術交流QQ羣(1041253375),與更多小夥伴一起探討提升開發技能!
HTML 轉 MD - SDK 安裝
一切都非常簡單。只需在終端中運行以下命令即可通過 .NET 安裝 Aspose.HTML for Python:
pip install aspose-html-net
您也可以下載 SDK 。
加入Aspose技術交流QQ羣(1041253375),與更多小夥伴一起探討提升開發技能!
使用 Python 將 HTML 轉換為 Markdown - 代碼示例
本節介紹如何以編程方式將網頁轉換為 Markdown 格式。步驟:
- 導入必要的模塊。
- 使用源 HTML 文檔初始化HTMLDocument類的對象。
- 實例化MarkdownSaveOptions類的實例。
- 調用convert_html方法將 HTML 轉換為 MD。
以下代碼示例可自動完成項目中的轉換。使用 Aspose.HTML for Python 通過 .NET 將 HTML 轉換為 Markdown 非常簡單。
from aspose.html import *
from aspose.html.converters import *
from aspose.html.saving import *
# Path for the working files.
inputDir = "file.html"
outputDir = "file.md"
# Initialize an object of the HTMLDocument class with a source HTML document.
document = HTMLDocument(inputDir)
# Instantiate an instance of the MarkdownSaveOptions class.
options = MarkdownSaveOptions()
# Invoke the convert_html method to convert HTML to MD.
Converter.convert_html(document, options, outputDir)
輸出:

結論
Aspose.HTML for Python via .NET是面向 Python 開發人員的解決方案。該 SDK 提供豐富的 HTML 文件轉換和操作功能。本文介紹瞭如何在 Python 中將 HTML 轉換為 Markdown。在接下來的文章中,我們將提供更多指南來探討更多主題。此外,將Aspose.HTML for Python via .NET集成到項目中後,HTML 到 Markdown 的轉換將不再是一項艱鉅的任務。
加入Aspose技術交流QQ羣(1041253375),與更多小夥伴一起探討提升開發技能!