WebスクレイピングでGNUサイトからライセンス情報を抽出してDBに挿入する
GitHubのライセンスマスターDBを作るために。
成果物
GNU.License.Database.Insert.201703181520
開発環境
- Linux Mint 17.3 MATE 32bit
- SQLite 3.8.2
- Python 3.4.3
前回まで
http://ytyaru.hatenablog.com/entry/2017/09/03/000000
今回
GNUサイトからライセンス情報を抽出した。
サイトのライセンスにより改変不可のため作成したDBファイルは配布できない。
課題
- 複数言語版も作りたい
所感
テーブルを作りなおすことになりそう。