やってみる

アウトプットすべく己を導くためのブログ。その試行錯誤すらたれ流す。

Calc HTMLを取り込む(WebQuery)

 主に<table>タグを表計算スプレッドシートに取り込む。

成果物

情報源

HTML

<!doctype html>
<html>
<head>
   <meta charset="utf-8">
   <title>HTMLファイルをCalc表計算ドキュメントに挿入する</title>
</head>
<body>
    <table>
        <caption>
            <details><summary>名前と年齢の一覧表</summary>
            <p>誰かしらの名前とその年齢を示した表である。</p>
            </details>
        </caption>
        <thead>
            <tr><th>Name</th><th>Age</th></tr>
        </thead>
        <tbody>
            <tr><td>山田</td><td>12</td></tr>
            <tr><td>鈴木</td><td>24</td></tr>
            <tr><td>田中</td><td>36</td></tr>
        </tbody>
        <tfoot>
            <tr><th colspan="2" align="right">powerd by <a href="https://github.com/ytyaru">ytyaru</a></th></tr>
        </tfoot>
    </table>
</body>
</html>

手順

  1. メニュー→シート外部データへのリンク
  2. 外部データソースへのURLにHTMLのURLを入力する
    • https://raw.githubusercontent.com/ytyaru/LibreOffice.Calc.Usage.20201006084708/master/src/0_guide/28_webquery.html
  3. インポートオプション自動にする
  4. 使用できる表と範囲のリストにHTML_1,HTML_all,HTML_Tablesが表示される
  5. HTML_Tablesを選択する
  6. OKボタンをクリックする

0 1 2 3 4

おまけ

HTMLへエクスポートする

  1. メニュー→ファイルエクスポート
  2. ファイル書式HTML(.html, .xhtml)にする
  3. エクスポートボタンをクリックする

所感

 ブラウザからHTMLテーブルをテキストコピーしてもできると思うけどね。むしろそっちのほうが早いのでは?

対象環境

$ uname -a
Linux raspberrypi 5.4.51-v7l+ #1333 SMP Mon Aug 10 16:51:40 BST 2020 armv7l GNU/Linux