2021-10-01から1ヶ月間の記事一覧
html.parserはPython製のため遅いらしい。そこでC言語製のlxmlにすると高速だとか。
RSSから30件のニュースを得て本文を抽出するまで10分近くかかった。20秒/1件。遅すぎる。
前回 * bashのブツを合併した。
最新の環境構築が面倒なのでコード書いた。
コンフリクトを変更した。
Webサービス。
最高だった。extractcontent3より良さげ。
今週のお題「読書の秋」に答える
リポジトリを作り直した。いくつか修正。
RSSの日付データはテキスト。その表現形式はUTC,JSTなどがありうる。これらをすべてYYYY-mm-ddTHH:MM:SSZ形式にしたい。SQLite3DBに登録するために。
違う。共通でない。
え、こんなのあったんだ。知らんかった。
急に「はてなブログでは標準的な医療情報と異なる見解が含まれたブログに警告を掲載することがあります」と言い出した。怖いので少し調べてみた。
外部ライブラリを使わなくてもできる。
はてなブログ10周年特別お題「私が◯◯にハマる10の理由」に答える。
私が自分でビルドしたやつは3.29.0なのに。
はてなブログ10周年特別お題「はてなブロガーに10の質問」に答える。
ターミナルのcdコマンドで移動したものが反映される
好きなプログラミング言語10選 はてなブログ10周年特別お題「好きな◯◯10選」に答える。
DBにまかせてPythonコードを減らす。
はてなブログ10周年特別お題「10年で変わったこと・変わらなかったこと」に答える。
表制約で複数列の一意チェックをする
RSSデータがDB最新より新しいかチェックする。
ソート済みリストの中から指定した値の位置を探す。高速に。
今週のお題「お風呂での過ごし方」に答える。
1キーずつ。ソート順位が低いほうから順に。
本文抽出がうまくいかないだろうから、1件だけ登録する。
あっさりできた。
ためしにやってみた。