Stories

Detail Return Return

Excel處理控件Aspose.Cells教程:使用 Python 將 HTML 轉換為 Excel - Stories Detail

網頁通常包含以HTML表格格式呈現的表格數據,例如報告、價目表或統計數據。處理網頁數據通常需要將 HTML 表格或頁面轉換為 Excel 電子表格,以便進行分析或生成報告。將這些數據導出到 Excel 後,可以進行排序、篩選和計算。使用 Python 自動化此過程可以確保準確性並節省時間,尤其是在處理大型或重複性數據集時。在本教程中,您將學習如何藉助Aspose.Cells使用 Python 僅用幾行代碼將 HTML 轉換為 Excel。

Aspose.Cells官方試用版免費下載,請聯繫Aspose官方授權代理商慧都科技

加入Aspose技術交流QQ羣(1041253375),與更多小夥伴一起探討提升開發技能。

Python HTML 到 Excel 轉換庫

Aspose.Cells for Python via .NET是一個高性能電子表格自動化庫,允許 Python 開發人員無需使用 Microsoft Excel 即可創建、編輯和轉換 Excel 文件。

它支持多種格式的讀寫,包括XLS、XLSX、CSV、HTML、ODS 等。開發人員還可以操作公式、應用格式、插入圖表,並以編程方式處理複雜的電子表格。這種靈活性使其成為自動化任務的理想選擇,例如將 HTML 報告、發票或表格轉換為 Excel 工作簿,以便進一步處理或分發。

在編寫代碼之前,請聯繫慧都科技進行下載或從PyPI安裝包。在終端中運行以下命令:

pip install aspose-cells-python

這將安裝 API 及其依賴項,使其可以在任何 Python 項目中使用。

使用 Python 將 HTML 轉換為 Excel

Aspose.Cells 允許將 HTML 文件或字符串直接轉換為 Excel 工作簿。然後您可以將其保存為 XLSX、XLS 或其他支持的格式。

按照以下步驟加載 HTML 並保存為 Excel:

  1. 使用該類加載 HTML 文件Workbook。
  2. 將工作簿保存為 XLSX 格式。

以下代碼示例在 Python 中加載 HTML 文件並將其導出為 Excel 格式。

from aspose.cells import Workbook

# Step 1: Define the input HTML file path
input_file = "sample.html"

# Step 2: Create a Workbook object and load the HTML
workbook = Workbook(input_file)

# Step 3: Save the file as Excel
workbook.save("output.xlsx")

使用 Python 將 HTML 轉換為 Excel

將 HTML 字符串轉換為 Excel

有時 HTML 內容位於內存中,而不是文件中。Aspose.Cells 允許您直接轉換 HTML 字符串,而無需事先保存。此方法非常適合將動態 HTML 內容即時轉換為 Excel 文件,例如在網頁抓取或數據提取腳本中。

按照以下步驟將 HTML 字符串轉換為 Excel:

  1. 使用包含 HTML 內容的內存流初始化工作簿。
  2. 將結果保存為 Excel 文件。

以下代碼示例顯示如何將 HTML 字符串導出到 Excel 工作表中:

from aspose.cells import Workbook, HtmlLoadOptions
from io import BytesIO

# Step 1: Define HTML string
html_data = """
<table border='1'>
<tr><th>Product</th><th>Price</th><th>Quantity</th></tr>
<tr><td>Laptop</td><td>800</td><td>5</td></tr>
<tr><td>Phone</td><td>400</td><td>10</td></tr>
</table>
"""

# Step 2: Convert HTML string to bytes
html_bytes = BytesIO(html_data.encode('utf-8'))

# Step 3: Load HTML from memory
options = HtmlLoadOptions()
workbook = Workbook(html_bytes, options)

# Step 4: Save as Excel
workbook.save("from_string.xlsx")

使用 Python 將 HTML 字符串轉換為 Excel

HTML 到 Excel 轉換的高級選項

Aspose.Cells 提供了對 HTML 文件的讀取和保存方式的高級控制。您可以使用該類HtmlLoadOptions來處理嵌入的圖像、格式或編碼。

按照以下步驟自定義 HTML 文件的加載:

  1. 創建該類的一個實例HtmlLoadOptions。
  2. 指定 HTML 加載選項。
  3. 使用類加載帶有選項的 HTML Workbook。
  4. 使用方法保存為Excel save()。

下面的代碼示例使用HtmlLoadOptions特定設置來處理 HTML 並保存為 Excel 文件。

from aspose.cells import Workbook, HtmlLoadOptions

# Step 1: Set HTML load options
load_options = HtmlLoadOptions()
load_options.auto_fit_cols_and_rows = True  # Automatically adjusts columns and rows

# Step 2: Load HTML with options
workbook = Workbook("sample.html", load_options)

# Step 3: Save as Excel
workbook.save("table_advanced.xlsx")

HTML 到 Excel 轉換的高級選項

何時使用加載選項

在以下情況下使用這些選項:

  • 您的 HTML 包含大表格或合併單元格。
  • 您想保留列寬和樣式。
  • 您需要自動調整佈局以提高可讀性。

將 HTML 轉換為多種 Excel 格式

Aspose.Cells 允許您根據需要將輸出保存為不同的電子表格格式。它能夠集成到需要不同導出格式的數據管道、儀表板或自動化工具中。

from aspose.cells import Workbook

workbook = Workbook("sample.html")

# Save to XLS format
workbook.save("output.xls")

# Save to CSV format
workbook.save("output.csv")

# Save to PDF for reporting
workbook.save("output.pdf")

總之,使用 Python 將 HTML 轉換為 Excel 是將基於 Web 的數據引入分析或報告環境的有效方法。使用 Aspose.Cells for Python,您只需幾行代碼即可完成此轉換,同時保持準確性、格式和性能。無論您是構建數據處理腳本還是將 Web 報表集成到 Excel 儀表板,Aspose.Cells 都能為您提供所需的所有工具。

Aspose.Cells官方試用版免費下載,請聯繫Aspose官方授權代理商慧都科技

加入Aspose技術交流QQ羣(1041253375),與更多小夥伴一起探討提升開發技能。

常見問題 (FAQ)

1. 我可以使用 Python 將 HTML 直接轉換為 Excel 嗎?

是的。您可以使用Aspose.Cells for Python via .NET庫將任何包含表格數據的 HTML 文件或字符串直接轉換為 Excel 。它會讀取 HTML 結構,並在輸出的 Excel 文件中保留表格、格式和樣式。

2. Aspose.Cells 支持將 HTML 字符串轉換為 Excel 嗎?

當然可以。您可以從字符串或內存流(而不是文件)加載 HTML 內容。當 HTML 是通過 Web 數據、API 或用户輸入動態生成的時,這非常有用。

3. 除了 XLSX 之外還支持哪些輸出格式?

除了XLSX之外,您還可以將 HTML 導出為XLS、CSV、ODS、PDFSaveFormat以及 Aspose.Cells 支持的其他格式。您只需在保存工作簿時指定所需的格式即可。

4. 我需要安裝 Microsoft Excel 才能使用 Aspose.Cells 嗎?

不需要。Aspose.Cells 是一個獨立的 Python 庫,不依賴於 Microsoft Excel 或 Office。您可以在任何系統上以編程方式執行所有轉換。

5. Aspose.Cells 可以處理大型或複雜的 HTML 表格嗎?

是的。Aspose.Cells專為高性能數據處理而設計。它可以高效處理包含多個表格、圖像或複雜佈局的大型HTML文件,確保Excel輸出的準確性。

user avatar zhipanyun Avatar lizhuo6 Avatar happy2332333 Avatar huyouxueboshi Avatar nut Avatar xishui_5ac9a340a5484 Avatar fenanjiu Avatar aaaaaajie Avatar ox1dp6ei Avatar chongdongdedaxiongmao_kxfei Avatar jueqiangderijiben_xuc2 Avatar xc_xiang Avatar
Favorites 18 users favorite the story!
Favorites

Add a new Comments

Some HTML is okay.