ログ日記

作業ログと日記とメモ

検索エンジンとSNSが合体した全文検索エンジンが欲しい

ブックマークしたページから数回層だけリンクをたどって後で検索できるようなものはないだろうか。

スコア計算はGoogle以前のものでもいい。
キーワードの回数、割合、単語の近さとか。

URL スコア 巡回リンク階層
https://news.yahoo.co.jp/ 2 5
https://b.hatena.ne.jp/user/ 20 3
https://qiita.com/my_favorite_user 10 3
https://example.com/ 5 10

こんな感じで、昔のホームページ保存ツールみたいにURLとリンク順回数を指定したらクロールしてほしい。
Chromeの拡張からポチっとすれば、デフォルトのスコアとリンク階層で登録できれば尚良い。

追加で、キーワードのスコアも設定できると良い。

キーワード スコア
プログラミング 5
PHP 10
Linux 10
affi.example.com -100
ad.example.com -100

textContentじゃなくてタグも全て検索対象として扱うようにして、アフィリエイトリンクがある記事はスコアを下げることもできるような感じで。

これで、自分だけの精度の高い検索エンジンができないだろうか。

クロールしたデータを一人しか使わないのはもったいないので、他の人が見てる情報も検索したい。

フォロー スコア
my_favorite_user 1.5
linux_user 0.5
wordpress_user 0.5
life_user 0.5
spam_user -1

こんな感じでフォローしたユーザーのクロールデータも検索できるようにして、自分を1とした場合のスコアも設定する。
フォロワーのフォロワーを何回層までたどるかという設定もあったら良いかもしれない。



というような妄想をさっきふと思い付いた。