[B! elasticsearch] kimutanskのブックマーク

Elasticsearchと機械学習を実際に連携させる

SensorBeeとfluentdを使ってElasticsearchに機械学習適用後のツイートを流し込んで検索や可視化を助ける話

kimutansk 2016/03/17

小粒で高速なストリーム処理＆機械学習適用を行うための存在と。用途的にパーティショニングされた前提で複数プロセス立ち上げてスケールするスタイルですかね。

リンク

機械学習を利用したちょっとリッチな検索

検索対象のデータに機械学習を利用して情報を増やし、それをナビゲーションの軸として使ったり集計や可視化で利用すると面白いよ、という話。

kimutansk 2016/01/10

SQLっぽい言語でストリームデータに対して特徴抽出/機械学習をUDFで実行可能なOSSが公開されると。

リンク

Beatsを使ってみた（まとめ編） | DevelopersIO

はじめに藤本です。先日、Beatsの3つのofficialy supported Beatsのやってみたブログをエントリしました。 Topbeat + boot2dockerでMacBookのシステムモニタリング Filebeat + boot2dockerでMacBookのログモニタリング Packetbeatでパケットモニタリングブログエントリの順番が完全に逆ですが、やってみたエントリでは説明をすっとばしていたので、今回はそれぞれの機能を簡単にご紹介します。 Beatsについて各々の説明の前にBeats Platformを説明します。 Beatsはデータ取り込みを行うプラットフォームとなります。Elasticの馴染みのあるデータ取り込みツールにLogstashがあります。日本ではFluentdを使われている方が多いでしょうか。Logstashは非常に豊富な機能を持っていて、更に

kimutansk 2015/12/21

出力先がES/Logstash固定の汎用データ収集エージェント基盤、みたいなノリですか。

リンク

(レポート) BDT209: リアルタイムデータ分析および可視化のためのAmazon Elasticsearch Service #reinvent | DevelopersIO

kimutansk 2015/10/08

IAMでインデックス単位で権限設定可能と。おなじみの構成ですが、AWSでサービスとして提供されると大幅に省力化できそうですね。

リンク

Elasticsearch を使った位置情報検索 - クックパッド開発者ブログ

ホリデー事業室の内藤です。ホリデー事業室は昨年の4月に発足した部署で、Holiday（https://haveagood.holiday）という新規サービスの開発を行っています。 Holiday とは、クックパッドが長年取り組んでいる「毎日の料理を楽しみにする」分野からは少しだけ離れ、「いつもの休日を楽しくすることで人生を豊かにする」ことを目指したサービスです。例えばこちらのおでかけプランのように、「〇〇に行くならここも行ったほうがいいよ」や「〇〇を散策するならこのコースだよね」など、おでかけのレシピを投稿したり探すことができるようになっています。今回は、全文検索エンジン Elasticsearch を使って、全文検索と位置情報を絡めた検索についてお話したいと思います。本稿で説明する内容は、実際に Holiday の中でも応用を加えた形で使われています。 Holiday では、複数

kimutansk 2015/03/12

住所＞GeoData変換やGeoData間の距離算出までは比較的簡易にできて、ESでも扱いやすいと。

リンク

Elasticsearch Internals: Networking Introduction

Search and analytics, data ingestion, and visualization – all at your fingertips.

kimutansk 2015/02/22

デフォルトだとノード追加するごとに各ノード間で13の接続をメッシュ状にはるわけですか。このコネクション数は中々。

elasticsearch

リンク

http://blog.yoslab.com/entry/2015/02/13/203251

kimutansk 2015/02/14

Elasticsearch導入チェックリストのOS部はHadoopと似たような内容ですね。大量データを分割して扱う場合には大体似る感じですか。

elasticsearch

リンク

Elasticsearch設定に関する小ネタ - Taste of Tech Topics

こんにちは、ツカノ(@snuffkin)です。この記事はElasticsearch Advent Calendar 2014の21日目です。 20日目はjtodoさんの「Spark on elasticsearch-hadoop トライアル」でした。さて、以前、「Elasticsearchソースコードリーディング～内部構造把握の第一歩～」と題してElasticsearchのスレッド構成といった内部構造の話を書きましたが、今回もまた、似たような話です。今回はElasticsearchの設定ファイルについてです。 1.ノード名について Elasticsearchのデフォルトのログフォーマットでは、ノード名が出力されます。クラスタで運用することも考えると、ノード名って重要ですよね。ノード名の設定方法については、公式ページに記載があります。ここで面白いのが、設定を省略した場合の動きです。M

kimutansk 2014/12/22

elasticsearch

リンク

ログ解析にNorikraを使ってみた - hase log

この記事は、CyberAgent エンジニア Advent Calendar 2014 の 17 日目の記事です。昨日は@neo6120さんのアドテクスタジオのゼミ制度の紹介と活動報告でした。 18日目は@sitotkfmさんのSpark StreamingでHyperLogLogを実装してみたです。弊社で、プラットフォーム機能の一部を作らせて頂いている、@hase_xpwです。 @kakerukaeruさんにやろうぜ！って誘われたので参加してみましたこれを機にブログもっと更新したいと思います！今回のテーマは、Norikraというミドルウェアで、業務でログ解析をする際に使ってみた所かなり便利だったのでNorikraの魅力を少しでもお伝えできればいいなと思いテーマに選びました。これおかしくね？みたいなのがあったらバシバシ指摘して頂きたいです。環境構築と使い方は、わかりやすくまと

kimutansk 2014/12/21

Norikraの多段適用ですか。基本シングルプロセスで動作するということはこういう形での拡張適用が行いやすいという形でもあるわけですね。

リンク

ElasticSearch: Unassigned Shards, how to fix?

I have an ES cluster with 4 nodes: number_of_replicas: 1 search01 - master: false, data: false search02 - master: true, data: true search03 - master: false, data: true search04 - master: false, data: true I had to restart search03, and when it came back, it rejoined the cluster no probl em, but left 7 unassigned shards laying about. { "cluster_name" : "tweedle", "status" : "yellow", "timed_out" : f

kimutansk 2014/12/12

後付けの再配置が有効になっていないと一度unassignedになるとそのまま残り続ける、という感じでしょうか。

elasticsearch

リンク

Elasticsearchのhead plugin - ほわいとぼーど

Rebuild.fmで聞いたlogstash形式が素晴らしいから頑張ってmappingをtemplatesにしたけど実はまだlogstash形式で動かしてみてない、っていう残念な記事が昨日でしたが、本日早速試してみました。 logstash形式にはしたばっかりでまだデータ溜まってないので、自力でlogstash形式になるようにログの日付と同じindexを作って入れて Kibana3でlogstash形式で見てみましたが普通に動きました。日付も@timestampではなくログから入れたrequest_time指定で問題なく。 ※このrequest_timeとかいう名前付けが紛らわしいかもしれないことを今更ながら気づきましたが今の所は勘弁してやってください。 Apache2ログにおける日付の部分を抽出したもののことです。きっとFluentd設定を説明する回があったらこの話もするはず

kimutansk 2014/12/12

Unassignedとなるのはレプリカ設定していてもノードが足りないから、でしたか。

elasticsearch

リンク

GitHub - elastic/es2unix: Command-line ES

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

kimutansk 2014/12/09

これはいいコマンド・・　というかクラスタのヒープとかまで見えますか。いいですね。

リンク

niconicoの検索を支えるElasticsearch // Speaker Deck

niconicoでのElasticsearch運用事例的なお話。第7回elasticsearch勉強会 #elasticsearch #elasticsearchjp elasticsearch.doorkeeper.jp/events/16837 報告ブログ記事 http://ch.nic…

kimutansk 2014/11/20

遭遇した問題やチューニングポイントがありがたいですね。やはり遭遇する問題はこんな感じですか・・

elasticsearch

リンク

『fluentd + Elasticsearch + kibanaでCassandraモニタリング』

はじめまして。インフラ＆コアテク本部の鳥垣と申します。普段はAmeba Smart Phone PlatformやAmebaの基幹系サービス全般のインフラを見る仕事をしております。昨今fluentd + Elasticsearch + kibanaを使ったリアルタイムモニタリングが流行っていますが、これを使ってCassandraのステータスをモニタリングするシステムを作ってみましたので、そのお話をさせていただければと思います。構築のきっかけこちらのサイトにてdstatのモニタリングをkibanaでやっている記事を拝見し、Cassandraのステータスも同じようにリアルタイムグラフの描画ができないかと考えました。以前にWebSocketで監視もリアルタイムにという記事でもあるとおりリアルタイムモニタの仕組みはありましたが、kibanaの検証も兼ねてリアルタイムのグラフ描画にチャレンジし

kimutansk 2014/10/31

「ElasticSearchのCPU負荷がすごいことになるｗ」あれま。ただそうなんでしょうね。

リンク

Kibana 4 BETAファーストインプレッション - Qiita

Kibana4のBETAがリリースされたことに、Kibana3のissueがcloseされた通知で気がついた。Kibana3のbugfixはやってくれなさそうだけど、とりあえず、Kibana4を試すことにした。必要なもの JVM Kibana 4.0.0-BETA1 Elasticsearch 1.4.0.beta1 初期設定 Kibana4をとりあえず使ってみるために必要な項目は次の通りだ。 Elasticsearch 1.4.0.beta1をセットアップする Kibana 4.0.0-BETA1をセットアップするインデックスの初期設定を行う Elasticsearch 1.4.0.beta1を準備する Kibana4ではElasticsearch 1.4以降が必要になっている。ベータ版がリリースされているので、適当にダウンロードして起動しよう。 Elasticsearch.org

kimutansk 2014/10/08

Kibana3とは画面構成やダッシュボード作る流れも違いますが、よりインタラクティブに操作可能と。後画面はデフォルト白系になったわけですか。

リンク

データ可視化に便利なkibanaは、elasticsearchのプラグインとして構成すると便利 #Fluentd - Y-Ken Studio

Fluentdなどから収集したメッセージをelasticsearchへ格納してKibanaで可視化するソリューションは素晴らしく、とても人気があります。次の画像のように見栄えが良いことも特徴です。このダッシュボードアプリであるKibanaはJavaScriptアプリケーションです。そのため静的ファイルを配置すればどこでも動きます。しかしそれだけのためにApacheやNginxなどのWEBサーバを新たに起ち上げるのは手間ですよね。実は新たに起ち上げない方法もあるのです。こんな時に役立つTipsを紹介します。 elasticsearchのsiteプラグイン siteプラグインは、ウェブベースのインターフェースを提供するものです。 elasticsearchの挙動へ変更を加えるものではないため、サービス停止(再起動)を行わずにインストール・アップデート・アンインストールができます。モニタ

kimutansk 2014/09/30

へぇ、ElasticSearchの上にホストすることも出来ましたか。これは便利そうです。

リンク

「関連する○○」機能を手軽に実現できる。そう、Elasticsearch ならね。 - クックパッド開発者ブログ

セコン (id:secondlife, @hotchpotch) です。ウェブサービスにはよく「このエントリーに関連するブログ記事」や「このレシピに関連するレシピ」という機能が実現されてますよね。さて、この機能はどのように実現すれば良いでしょうか。例えば tf-idf で単語の類似度を求め…といった実装が必要になり、いささか面倒です。しかしながら Elasticsearch や Solr *1を使うと手軽に実現できます。例えば、クックパッドニュースの記事では Solr を使い「この記事を読んだ人におすすめ」の機能に、最近クックパッドにジョインしたインドネシアの会社の DapurMasak では Elasticsearch を使い「Resep serupa(関連レシピ)」の機能で利用しています。クックパッドニュースでのこの記事を読んだ人におすすめ DapurMasak での関連レシピ使

kimutansk 2014/09/26

more like thisのAPIは使ったこと無かったので今度叩いてみましょう。専ら可視化に使うとこのあたり使う機会が無いですので。

リンク

ElasticSearch勉強会第6回

【第26回Elasticsearch勉強会】Logstashとともに振り返る、やっちまった事例ごった煮

kimutansk 2014/09/17

参考になる実例ですが、3万Req/秒捌くのに8コア32GBクラスのマシンを28ノード用意する必要がありますか。考えなしにログ投入、というわけにはいきませんね

リンク

Elasticsearchのインデキシングに関するパフォーマンス検討

Elasticsearchのインデキシングに関するパフォーマンス検討原文：performance considerations for elasticsearch indexing Elasticsearchユーザは様々な楽しいユースケースを持っています。小さなログを追加することから、Webスケールの大きなドキュメントの集合をインデキシングするようなことまでです。また、インデキシングのスループットを最大化することが重要で一般的な目標となります。「典型的な」アプリケーションに対して良いデフォルト値を設定するようにしていますが、次のちょっとした簡単なベストプラクティスによってインデキシングのパフォーマンスをすぐに改善することができます。それらについて記述します。第一に、制御できないならば、巨大なJavaヒープを使用しない：必要なサイズ（マシンの持つRAMの半分以下）のheapだけを設定し