「EchizenBlog-Zwei」のTwitterでの新着ページ

渋谷の会社に転職しました - EchizenBlog-Zwei d.hatena.ne.jp/echizen_tm

渋谷の会社に転職しましたその他というわけで転職しました。渋谷といってもモゲマスの会社ではなくDSIRNLPのときにお世話になっていた会社です。待遇や環境、仕事内容などあらゆる面が大幅に改善されモチベーションがうなぎのぼりです。さらに前職同様、一緒に仕事をする方にも恵まれていて圧倒的な感じがします。思わず最善を尽くしたいと思える環境でした。がんばります。Permalink | コメント(0) | トラックバック(0) | 01:43

d.hatena.ne.jp/echizen_tm/20120501/1335890592

IT

「閉じこもるインターネット――グーグル・パーソナライズ・民主主義」を読んだ - EchizenBlog-Zwei d.hatena.ne.jp/echizen_tm

「閉じこもるインターネット――グーグル・パーソナライズ・民主主義」を読んだ書籍「閉じこもるインターネット――グーグル・パーソナライズ・民主主義」を読んだ。フィルターバブル(受け取る情報がパーソナライズによって偏向されている状態)のお話。本書はフィルターバブルによってパーソナライズを行う側がサービスを受けるユーザをコントロールできる危険性について書いてある。と同時にパーソナライズの利便性についても。要は何が起きているのかが少ない労力で理解できてユーザが必要な時だけ利用できるように、と。フィルターバブルという

d.hatena.ne.jp/echizen_tm/20120429/1335699401

転職します - EchizenBlog-Zwei d.hatena.ne.jp/echizen_tm

転職しますその他個人的な報告で恐縮ですが本日を以って今の職場(以下、現職)の最終出社を迎えました。「ここはルイーダの酒場。旅人たちが仲間をもとめて集まる出会いと別れの酒場よ」私にとって現職はルイーダの酒場のような場所でした。多くの優れた人々との出会いは私にとって大きな刺激となりました。私が必死で乗り越えた壁を、いとも容易く乗り越えて遥か彼方をスキップしているような凄まじい技術力を持ったエンジニアに囲まれて非常に大きな刺激を受けました。具体的には「ちょっと暇だった」と言って片手間で実用的なダブル配列を実装し

d.hatena.ne.jp/echizen_tm/20120427/1335513897

ライフスタイル

2011-02-14 - EchizenBlog-Zwei d.hatena.ne.jp/echizen_tm

SVMツールと関連する論文まとめ計算機科学最近SVM(Support Vector Machine)周りの復習をしているので有名どころのツールと、それに関連する論文をまとめた。完全に個人用メモなので抜けがあるかも。あくまで参考程度に。ツールは色々あるけれど使うのが目的なら定番のsvmlightやlibsvmがいい気がする。最近だとliblinearが流行っている。SVMといえばカーネル関数とマージン最大化だけれど、最近ではカーネルは線形でいいやという流れになってきている?個人的にはpegasosがわかり易

d.hatena.ne.jp/echizen_tm/20110214

【たのしい自然言語処理シリーズ】サザエさんにじゃんけんで50%勝つ方法 - EchizenBlog-Zwei d.hatena.ne.jp/echizen_tm

【たのしい自然言語処理シリーズ】サザエさんにじゃんけんで50%勝つ方法計算機科学最近サザエさんとキュアピースのじゃんけん対決が話題になっている。じゃんけんポンで日曜日またこれに関連して「サザエさん ジャンケン学」というサイトが注目を集めている様子。サザエさん ジャンケン学このサイトによるこれまでの予測的中率は44.7%とのこと。さて自然言語処理という技術の分野ではNgramモデルというものがある。これは簡単に言うと「まことに」という言葉の後には「残念ですが」という言葉がつながりやすいとか、「ちょっと」の後

d.hatena.ne.jp/echizen_tm/20120328/1332935550

良い技術書は3パターンに分類できる気がする - EchizenBlog-Zwei d.hatena.ne.jp/echizen_tm

良い技術書は3パターンに分類できる気がする書籍いけてるエンジニアが「これは良書だ!」と絶賛しているので買ってみたら、よくわからないことが書いてあるだけで理解できなかった。という経験をした人は多いのではないかと思う。こういうことはなぜ起きるかというと、別にいけてるエンジニアが初心者に意地悪をしているわけでもないし、いけてるエンジニアとは頭の出来が違いすぎたということもなく、単純に「良書」には複数のパターンがあるからなのでは、と私は思っている。全くの私見だが大別して3パターンある気がする。以下、これについて述

d.hatena.ne.jp/echizen_tm/20120327/1332857371

「珠玉のプログラミング」のコラム2を再読した - EchizenBlog-Zwei d.hatena.ne.jp/echizen_tm

「珠玉のプログラミング」のコラム2を再読した計算機科学チュートリアル記事を書いていたら懐かしくなったので、思わず続きを読むなどした。コラム2は以下の3つの問題を扱っている。- ある範囲の数値で抜けているものを探す。(同じものは一回だけ出現)- 文字列の先頭のn文字を末尾にくっつける。- ある単語とアナグラムの関係になっている単語を辞書から探す。どれもよく見る問題だけれど改めて見てみると大切な事がたくさん詰まっている良い問題ばかり。最初の問題は二分探索で解く。最初にデータを中央値より小さいものと大きいものに

d.hatena.ne.jp/echizen_tm/20111017/1318854612

気がついたら「お前のご奉仕はその程度か?」にハマっていた - EchizenBlog-Zwei d.hatena.ne.jp/echizen_tm

気がついたら「お前のご奉仕はその程度か?」にハマっていた書籍森田季節先生の「お前のご奉仕はその程度か?」が実は超面白いのではないかという気がしてきた。1巻を読んだときは独特の文体(これでも森田作品では普通な方らしい)に圧倒されたが気がついたら抜け出せない所まで来ていた。なにやらドラマCDが出ていたり、今度コミック化もするらしいして実は人気あるのだろうか。ともあれハマってしまったからには記事を書かないわけにも行かないので記事を書いておく。本作は1巻の時点でヒロインが6人もいたり、世界観が適当っぽかったりとど

d.hatena.ne.jp/echizen_tm/20120219/1329657766

簡潔データ構造を使った全文検索アルゴリズム、FM-Indexのライブラリを作りました - EchizenBlog-Zwei d.hatena.ne.jp/echizen_tm

簡潔データ構造を使った全文検索アルゴリズム、FM-Indexのライブラリを作りました計算機科学先日公開したウェーブレット木のライブラリshellinfordにFM-Indexの機能を追加した。まだ基本的な機能しか実装していないけれど、とりいそぎ公開しておく。おいおい機能は追加していく予定。 shellinford - shellinford: succinct document retrieval library - Google Project Hosting An alphabet-friendl

d.hatena.ne.jp/echizen_tm/20120210/1328893184

「mixi Engineers’ Seminar #3」に参加しました - EchizenBlog-Zwei d.hatena.ne.jp/echizen_tm

「mixi Engineers’ Seminar #3」に参加しました計算機科学参加してきました。簡単にメモ。mixi Engineers’ Blog >> mixi Engineers’ Seminar #3のお知らせ一人目は高村本で有名な高村(@hjtakamura)先生(って変な表現だな・・・)。大学の話からはじまって自然な形で評判分析の話題に移る流れがすごい。このプレゼンは見習いたい!評判の極性判別ということで機械学習のお話がメイン。生成モデル(ナイーブベイズ)から入って識別モデル(C

d.hatena.ne.jp/echizen_tm/20120202/1328201636

IT

自然言語処理とか機械学習とかグラフとか簡潔データ構造とか全部入った良書「日本語入力を支える技術」がすごい - EchizenBlog-Zwei d.hatena.ne.jp/echizen_tm

自然言語処理とか機械学習とかグラフとか簡潔データ構造とか全部入った良書「日本語入力を支える技術」がすごい書籍@tkngさんの力作「日本語入力を支える技術」が2/8に発売される。既に秋葉原のヨドバシ有隣堂や池袋のジュンク堂本店では早売りされている様子。ってことで早速購入してきた。本書が扱うテーマはGoogleIMEのような「日本語入力」のシステム。これだけだとさして興味ないや、って人も多いかもしれない。ところがこの日本語入力というのは技術的には形態素解析に非常に近い。自然言語処理やテキストマイニングに関わる

d.hatena.ne.jp/echizen_tm/20120202/1328207315

IT

ウェーブレット木のライブラリshellinfordを作ったので公開しておく - EchizenBlog-Zwei d.hatena.ne.jp/echizen_tm

ウェーブレット木のライブラリshellinfordを作ったので公開しておく計算機科学ついかっとなってウェーブレット木のライブラリを作ってみた。せっかくなので公開しておく。LOUDSはerika-trieを作ったので今度はウェーブレット木を作りたかった。ライブラリ名はおおかたの予想を裏切りshellinford。かびーん。なお、ウェーブレット木で用いている簡潔ビットベクトルは前回のDSIRNLPで発表したものの公開していなかった「少ない労力でそこそこいけてるビットベクトル」を使っている。shellinfor

d.hatena.ne.jp/echizen_tm/20120201/1328105275

webエンジニアがMHP3をやるべき10の理由 - EchizenBlog-Zwei d.hatena.ne.jp/echizen_tm

ゲーム私の周りではPSPゲームソフト、MHP3(モンスターハンターポータブル3rd)が大流行している。そこで何故このゲームがwebエンジニアに大ウケなのかを考えてみた。 1.一回のクエストが最大50分 1日1クエストと自分を戒めておけば ダラダラ長時間遊んでしまうことがない。 なお大抵のクエストは30分以内で終わる。 2.コミュニケーションが活発化 共通の話題でまわりのエンジニアと交流がはかれる。 なにかと殺伐としがちなwebエンジニアにとっては 必携のツールと言える。 3.効率的に遊ぶほど面白く感じるバ

d.hatena.ne.jp/echizen_tm/20101202/1291308169

ゲーム・アニメ

連想配列はトライでしょ的な話がでていたので入門記事を書いてみた - EchizenBlog-Zwei d.hatena.ne.jp/echizen_tm

連想配列はトライでしょ的な話がでていたので入門記事を書いてみた計算機科学なにやらDan Kogai氏の以下の記事が話題になっている様子。404 Blog Not Found:Algorithm - 連想配列の実装としてのハッシュはオワコン?連想配列(キーワードを投げると対応する値が返ってくるデータ構造)はハッシュテーブルで実装するのではなく、これからはトライ(trie)木を使うのがイケてる!(意訳)という内容だった。連想配列にハッシュテーブルを使うのが良いか悪いかについては色々と意見があると思うので特にこ

d.hatena.ne.jp/echizen_tm/20120117/1326807278

IT

魔装機神II REVELATION OF EVIL GOD はじめました - EchizenBlog-Zwei d.hatena.ne.jp/echizen_tm

魔装機神II REVELATION OF EVIL GOD はじめましたゲームはじめました。ゲーム進めるのに忙しいので取り急ぎメモ。ネタバレしない方向で気づいたことを書いておく。ちなみにまだ序盤です(第5話)。念のため。 前作組は強いけど政治的な調整のためによく駆り出されて不在。 若手の新キャラはほぼ常に使える。よって前作組でフォローしつつ若手を育てるのが急務。 まるで職場。なんぞ・・・。 武器はフル改造で攻撃力+1500 ただしマップ兵器はフル改造で+3000。攻撃範囲は前作より狭い(1-3とか)けど便

d.hatena.ne.jp/echizen_tm/20120113/1326480820

マルチキー・クイックソート(multikey-quicksort)で高速に文字列ソート - EchizenBlog-Zwei d.hatena.ne.jp/echizen_tm

マルチキー・クイックソート(multikey-quicksort)で高速に文字列ソート計算機科学一般にソートアルゴリズムの計算量はソート対象となるデータ数NについてO(N^2)とかO(NlogN)等で評価する。数値データのソートであれば特に問題はないのだが、文字列データの場合は一回の比較に対して文字列長Mに比例する計算量O(M)がかかってしまう。例えばクイックソートであればO(NlogN)ではなくO(MNlogN)となる。よってMが非常に大きい場合はソート性能の劣化を招く。文字列ソートに付いてはBentl

d.hatena.ne.jp/echizen_tm/20100815/1281872393

テキストデータを使ってお手軽にNgram統計を取る方法 - EchizenBlog-Zwei d.hatena.ne.jp/echizen_tm

テキストデータを使ってお手軽にNgram統計を取る方法計算機科学テキストデータの言語的な特徴を知りたい場合、そのデータを使ってNgram統計を取ることがよくある。Ngram統計というのはテキスト中の連続したN文字それぞれが何回出現したかの統計をとること。といわれてもピンとこない人もいるかも知れない。実例を見るのが早いので当ブログの昨年12月の記事タイトルを使ってNgram統計を取ってみる。まず記事タイトルを一行一列でテキストファイルに書き出す。$$ cat blog-title.txt「PIANO OPE

d.hatena.ne.jp/echizen_tm/20120108/1326037639

簡潔ビットベクトル性能評価実験のソースコード(rx-trie編) - EchizenBlog-Zwei d.hatena.ne.jp/echizen_tm

簡潔ビットベクトル性能評価実験のソースコード(rx-trie編)計算機科学rx-trieで使われている簡潔ビットベクトルの評価実験に用いたソースコードをおいておきます。rx-trieのbv構造体にはファイル読み書きの関数が無かったので構築と評価を同時にやってしまっています。簡潔ビットベクトル構築&評価用コード(rx_test.cc)#include <iostream>#include <ctime>using namespace std;struct bv { cons

d.hatena.ne.jp/echizen_tm/20111222/1324571356

簡潔ビットベクトル性能評価実験のソースコード(marisa-trie編) - EchizenBlog-Zwei d.hatena.ne.jp/echizen_tm

簡潔ビットベクトル性能評価実験のソースコード(marisa-trie編)計算機科学評価実験に用いたソースコードをおいておきます。これを用意するときに気づいたのですが、rank/select呼ぶ度に標準出力に書き出してるせいでめちゃくちゃ遅くなってたっぽい。適当な実験で迷惑かけてすみませんでした。。。というわけでまずはmarisa-trie用のコードを。長くなるのでライブラリ毎にエントリを分けます。簡潔ビットベクトル構築用コード(marisa_make.cc)#include "vector.h&

d.hatena.ne.jp/echizen_tm/20111220/1324398743

1 2 3 4 5 6 次のページへ »

このサイトについて

TwitterでつぶやかれているURLを収集し「いま」旬のサイトがわかるWEBサービスです。各ジャンルの人気サイトがわかるのでWEBマーケターの方にも便利です。
続き...

このエントリーをはてなブックマークに追加

話題のサイトを検索