坊主が上手にHatenaに坊主のコードを書いた

ITBOZEによるIT技術の備忘録ブログ

「福岡Groonga1」、マジで良かった話

福岡初のGroongaイベント福岡Groonga1に参加!
(2015年01月23日(金)19:00〜、at GMOペパボ株式会社 福岡支社)

福岡Groonga1 - Groonga | Doorkeeper

まず、すごい人がたくさんいて、驚いた。

・須藤功平さん(@ktou): Groonga開発者のお一人

・おんがえしさん(@ongaeshi): MilkodeやHonyomiなどGroonga(Rroonga)を使ったアプリケーション

・近藤 宇智朗さん: パーフェクトRubyの著者のお一人

などなど。。。


<勉強会の流れ>


1. 自己紹介

(1) 参加者のみなさん、それぞれ自己紹介。

(2) もう既に、実運用でGroongaを使っている方もいて、後で濃い話を聞けることになる。。。


2. 今日知りたい事

(1) 参加者のみなさんからのリクエスト

(2) 質疑応答で、須藤さんから丁寧に答えていただいた。


3. おんがえしさんからのお話

MilkodeやHonyomiなどGroonga(Rroonga)を使ったアプリケーションについてのお話

(1) Groonga(Rroonga)の実運用のお話や、実際のアプリを見ることができたのは、大収穫!!

(2) おんがえしさん、ぜひgemを使わせていただきます!!

ongaeshi (ongaeshi) · GitHub


4. 質疑応答など

(1) 全文検索の基礎(文書,lexicon,トークナイザなどなど)を分かりやすく話していただいた。その分かりやすさに、感動した。

(2) 実運用でのお話もしていただいた。  これは、これから本格的に使っていこうと思っている自分にとって、とても嬉しい情報だった。

(3) Elastic Search等との比較について

・導入が容易(Elastic Searchのような細かい設定はない。導入への敷居が低い)  
・他のシステムとの連携が容易  
・MySQLに組み込める  
・Nginxにも組み込める  
・データが大きくなってきた時、Spider(MySQLのプラグイン)は良いよ。  
・インデックスのデータが増えた時  
 →テーブル毎に分けて、リングバッファを作成すると、データを消しやすい。  
・ メモリ使用量について(mmapのお話など)  
・「0000-00-00」は、不正な値なので、使用しない方が良い。  
・途中でトークナイザを変更したい時  
 →1つの文書にn個のトークナイザを張れるので、 語彙表(タームテーブル)から作り直して移行すると良い。  
・複雑な検索(ネストした検索)は、どうしたらよいか?  
 →rangeフィルターの考え方を参考にしてみては?  

などなど。

須藤さんが、1つ1つの質問に、分かりやすく答えていただいたので、

Groongaへの心の敷居が低くなった。

うん、使うぞ!

Groongaへの情熱に火がついた。