やってみる

アウトプットすべく己を導くためのブログ。その試行錯誤すらたれ流す。

2021-10-25から1日間の記事一覧

HTMLの本文抽出(readability-lxml)

最高だった。extractcontent3より良さげ。