sansan DSOC


  • DSOC RECRUITMENT
  • DSOC RECRUITMENT
  • DSOC RECRUITMENT
  • DSOC RECRUITMENT
  • DSOC RECRUITMENT
  • DSOC RECRUITMENT
  • DSOC RECRUITMENT
  • DSOC RECRUITMENT
  • DSOC RECRUITMENT
  • DSOC RECRUITMENT
  • DSOC RECRUITMENT
  • DSOC RECRUITMENT
  • DSOC RECRUITMENT
  • DSOC RECRUITMENT

MENU

ENTRYJOIN US

  • ABOUT DSOC
    DSOC(Data Strategy & Operation Center)は、Sansan株式会社のデータ統括部門です。あらゆる種類のビジネスデータに向き合い、Sansan株式会社の事業を支え続けるとともに、研究開発を通して新たな価値を創出することで事業成長をけん引する組織として活動しています。
  • OUR MISSION
    Activating Business Data名刺をはじめ、請求書や契約書といったビジネス書類、企業が公開する情報、調査機関などが収集・発表する情報
    ――DSOCが取り扱うのは、あらゆるビジネスデータです。「ビジネスの出会い」をデータとして捉え、そこに異なるデータを結び付けることで、データの価値を増幅させ、新しい可能性を見いだしていく。世界中に散らばるビジネスデータに命を吹き込み、ビジネス、社会、そして出会いの未来を変えていきます。
  • LINKS
MEMBERS’VOICES / LEADERS IMG
MEMBERS’VOICES / LEADERS IMG
vol.
  • LEADERS
    SHIMPEI
    NAGAI


  • R&D
  • データ
  • 多様な研究者

DSOCの研究開発部は、名刺をはじめとした、あらゆるビジネスデータをデータ化・整理する技術の研究開発、データの活用に関わるR&Dを一手に引き受けている。データ化の自動化を推し進め、データの名寄せを高精度化し、そして社会科学系の知見から新たな「問い」を見つけ出す。DSOCの研究開発部について、その全体像を聞いた。


  • MEMBERS’VOICES / LEADERS MESSAGE
  • MEMBERS’VOICES / LEADERS MESSAGE
  • MEMBERS’VOICES / LEADERS MESSAGE
  • MEMBERS’VOICES / LEADERS MESSAGE
  • MEMBERS’VOICES / LEADERS MESSAGE
  • MEMBERS’VOICES / LEADERS MESSAGE
  • MEMBERS’VOICES / LEADERS MESSAGE
  • MEMBERS’VOICES / LEADERS MESSAGE
  • MEMBERS’VOICES / LEADERS MESSAGE
  • MEMBERS’VOICES / LEADERS MESSAGE


  • MEMBERS’VOICES / LEADERS MESSAGE
  • MEMBERS’VOICES / LEADERS MESSAGE
  • MEMBERS’VOICES / LEADERS MESSAGE
  • MEMBERS’VOICES / LEADERS MESSAGE
  • MEMBERS’VOICES / LEADERS MESSAGE
  • MEMBERS’VOICES / LEADERS MESSAGE
  • MEMBERS’VOICES / LEADERS MESSAGE
  • MEMBERS’VOICES / LEADERS MESSAGE
  • MEMBERS’VOICES / LEADERS MESSAGE
  • MEMBERS’VOICES / LEADERS MESSAGE
  • 研究開発部 部長/
    永井晋平
    2007年、Sansan株式会社の第一号社員として入社。クラウド名刺管理サービス「Sansan」の開発に従事し、現在は研究開発部の部長を務める。Sansanのミッション実現に向けて、DSOCのメンバーやプロジェクトのマネジメント業務を精力的に行う。


MEMBERS’VOICES / LEADERS IMG

82
82
研究開発部の役割について教えてください。
永井
名刺のデータ化をはじめとして、DSOCが事業部に提供するサービスの開発で必要となるR&Dを担当しています。ここに全体の4割のリソースを充てています。次に、Sansan株式会社がSansanとEightといった事業を展開していく中で顕在化した課題を解決するR&Dにも取り組んでいます。この部分に、さらに全体の4割を充てています。私は、これら8割のリソースをかけた取り組みを「深化」と表現しています。既存の仕組みをベースにして、その価値をより深めていくような取り組みです。
 
その一方で、全体の2割のリソースを「探索」の領域に充てています。正解が見えない、試行錯誤が必要な領域におけるR&Dです。DSOCが構築する「出会いのデータベース」から新たな価値を見いだして、どのようにユーザーに届けるかを「探索」しています。「深化」だけではなく「探索」もまた、DSOCとして取り組むべき重要なことだと考えています。
1
Sansan:Sansan株式会社が提供するクラウド名刺管理サービス。社内にある全ての名刺を集約し、ビジネスプラットフォームとして活用することができる。
2
Eight:Sansan株式会社が提供する名刺アプリ。取り込んだ名刺から、利用者個人のビジネスネットワークが構築され、ビジネスSNSとして活用できる。
3
出会いのデータベース:DSOCが取り扱う、唯一無二のデータベース。ビジネスの出会いをデータとして捉え、その出会いのデータにあらゆるビジネスデータを掛け合わせることで構築を続けている。
研究開発のテーマは、どのように設定していますか。
永井
それぞれの研究員がさまざまなテーマを設定して、R&Dに取り組んでいます。例えば「名刺のデータ化を100%自動化する」というテーマは、DSOCにおける究極的な目標の一つです。SansanやEightのユーザーは、名刺を取り込んだ瞬間、自動的にデータ化される体験を望んでいます。その重要性は否定できません。ただし、その実現は非常に難しい。100%の自動化は、今なお実現できていません。しかし、アイデアとしては常に温めていて、このテーマにずっと取り組んでいます。
 
研究開発におけるテーマ設定は、とても難しいことです。当社のCPOである大津裕史は、「アイデアがアイデアのまま実現されていない状態である理由は、そこに価値がないか、あるいは実現が難しいかのどちらか」と話していました。日々のテーマ設定において、そのどちらなのか、見極めを間違えてはいけません。価値があり、実現が難しく、しかもDSOCとして取り組むべきことである、そういうテーマを見つけていきたいと思っています。


MESSAGE BGMESSAGE BG
価値があり、実現が難しく、
しかもDSOCとして取り組むべきこと。
そういうテーマを見つけていきたい。


永井
DSOCにおけるR&Dには、大きなゴールがあります。名刺をはじめとしたビジネス情報のデータ化も、データを整理するために必要な「名寄せ」も、その先にあるのは「Activate Business Data」というDSOCが掲げるミッションです。世界中に散らばっているビジネスデータを価値あるものにして、ビジネスシーンで会社を調べるとき、人を調べるときにSansan株式会社のサービスを使うことが当たり前になる。そんな世界を作っていきたいと考えています。


MEMBERS’VOICES / LEADERS IMG


R&D
R&D
研究開発部は、どのような組織構成で業務を進めていますか。
永井
現在の研究開発部は、4つのグループで構成されています。画像処理、機械学習や自然言語処理といった領域でだけでなく、経済学や社会学といった文系の研究者も所属しています。幅広い分野の研究者やR&Dエンジニアが所属していることは、組織としての特長と言えます。
研究開発部に属する各グループの役割について教えてください。
永井
Automation Groupは、名刺をはじめとする非定型でアナログな情報のデータ化における効率化や自動化に向けた技術開発を行っています。このグループには、画像認識や深層学習を追求する研究員が所属しています。2020年11月に発表したDSOC OCRは、このグループが開発したものです。直近は、名刺だけでなく、請求書や契約書といったビジネス書類のデータ化における効率化・自動化にも取り組んでいます。Automation Groupの研究員たちは、先ほど挙げた「名刺のデータ化を100%自動化する」というテーマに取り組み続けています。
 
Data Analysis Groupは、ビジネスデータで解決できそうな問題に対して幅広く取り組むグループですが、ビジネスデータの整理に欠かせない「名寄せ」の技術開発をはじめ、情報の抽出・分類やフィルタリングといったユーザーに提供する情報の最適化のための分析・技術開発にも取り組んでいます。このグループには、機械学習や自然言語処理、画像処理、深層学習の専門家が研究員として所属しています。既存の仕組みや技術を磨き、それらを発展させていくことに向き合いながら、新規事業開発室と連携した取り組みも行っています。
 
SocSci Groupは、社会科学の各領域を専攻する研究員が所属するグループです。このグループが持つ大きな役割の一つが、「このデータで、何ができるのか」という「問い」を作ることを通して、名刺交換の価値を拡張することです。DSOCが扱う「出会いのデータベース」があるからこそ生み出せる新しい価値や体験が必ずあります。問いを作る。それをユーザー価値につなげることは、簡単ではありません。そのために、外部有識者との共同研究も積極的に行っています。
 
Arc Groupは、「研究開発部が提供するサービスに責任を持つ」「DSOCをデータで支える・リードする」をミッションとして掲げ、成長するサービスの「健康状態」を保つ役割を担っています。これまでも研究員の中にアーキテクトの役割を果たしていたメンバーが数名いたのですが、その役割を組織として具体化したものです。研究開発部の開発生産性に向き合いながら、研究開発部の提供するサービスのソフトウエアとしての設計、サービスとしての可用性をはじめとした品質に加えて、研究開発部の開発生産性にも向き合っています。
4
DSOC OCR:DSOCが独自に開発した、名刺の取り込みに特化したOCR(光学文字認識)エンジン。2020年11月の発表時点では、「Eメールアドレス」と「氏名」に対応している。Eメールアドレスに関しては、99.7%の精度でデータ化することが可能。名刺全体にデータ化範囲を広げられるように開発を進めている。


MEMBERS’VOICES / LEADERS IMGMEMBERS’VOICES / LEADERS IMG


R&D
「深化」とは、具体的にどのようなことに取り組んでいるのでしょうか。
永井
一つは、名刺という「ビジネスの出会い」をデータ化することに関連したR&Dです。例えば、2019年から2020年にかけて開発したDSOC OCRを活用することで、名刺のデータ化フローにおける自動化がさらに進みました。2020年11月の発表時点では、名刺に書かれたメールアドレスを99.7%の精度でデータ化します。そして、その影響はDSOCで行う名刺のデータ化だけにとどまっていません。既存サービスにおける機能開発や新規事業など、DSOC OCRの研究開発によってSansan株式会社の「できること」が想像以上に広がってきています。
 
これ以外にも、名刺のデータ化におけるさまざまなR&Dが少しずつ進展しています。例えば、これまではSansanやEightといったサービスのスマートフォンアプリで名刺を撮影する場合には、ユーザーが名刺を画面に表示された枠の中に入れて撮影をする必要がありましたが、現在はそのようなことをしなくてもシステムが名刺を認識します。私たちのR&Dを通して、新しい体験を作っていくような取り組みも、引き続き行っていきたいと考えています。
 
もう一つは、データを整理する領域での取り組みです。ユーザーに提供する情報を最適化する、さまざまなエンジンの開発なども行っていますが、代表的なものは、「名寄せ」の高度化・高精度化です。これまでに蓄積した豊富なデータを活用した機械学習も取り入れています。ここで重要なのは、間違えた入力を見つけて正しいデータに「名寄せ」するときに、「なぜ間違えたのか」を知れることです。そのため、中身がブラックボックスになりがちな深層学習ではなく、解釈可能な技術を選定しています。




「探索」の領域についても取り組んでいることを教えてください。
永井
SocSci Groupの研究員は、DSOCが構築し続けている「出会いのデータベース」を分析しています。自社の事業だけでなく、社会へ共有することも目的の一つとして、得られた研究成果はさまざまな学会での発表しているほか、DSOC Data Science Reportの発行などを通して対外的に公開しています。また、研究成果を基に開発した実験的な機能群をSansan Labsとしてユーザーに提供もしています。
 
DSOCでは、研究そのものを目的にはしていません。最終的にユーザー価値に通じるものなのか、そこを重視しています。もし「研究に取り組んで論文を書きたい」というメンバーがいた場合には、まずその目的を聞きます。仮に距離は遠かったとしても、将来的にユーザー価値に結び付く可能性を秘めたものであれば、チャレンジする意義はあると考えています。
5
Sansan Labs:クラウド名刺管理サービス「Sansan」上で展開する実験的なサービスプラットフォーム。DSOCの研究成果から開発した実験的な機能群を提供している。
Sansan株式会社における研究開発部の位置付けは、どのようなものになりますか。
永井
各サービスの事業部と適度に近く、適度に距離があることがいい点だと考えています。各サービスの事業部と距離が近いことで、巻き込まれる、巻き込んでいくというダイナミズムが生まれます。また、事業部とのコミュニケーションを通して、本当に向き合うべき課題、解決方法が見えてきます。具体課題に向き合う中でビジネス、ドメイン、データの知識を蓄え、そこから効果的な「探索」テーマを設定できるものとも考えます。
 
部門に閉じて探索的な研究開発に向き合うことは、プロダクト化の確度を低くしますし、事業部に入れば思考は短期に寄ります。ちょうど良い距離が、今は作れていると感じています。
今後の組織づくりにおいて、何か考えていることはありますか。社会人博士を支援する制度も作ったと聞きました。
永井
自分たちも組織として変化していくことは非常に重要だと考えています。そこで、研究開発部内で組織デザインタスクフォースチームというものを作りました。必要な変化を考えてアクションしていきます。
 
制度についてですが、博士課程を出ている人たちは、研究する力、提案を実行する力が高い。その能力を磨けるなら、磨いて欲しい。そう考えています。DSOCに社会人博士を目指して週4勤務で頑張っていたメンバーがいたのですが、今の私たちの身の丈にあった形で良いから支援の形があるべきと考えて、制度を新たに設計して全社で導入しました。2020年9月から運用しています。


MEMBERS’VOICES / LEADERS IMG


研究開発部で活躍できるのは、どのような人ですか。
永井
「知行合一」という考え方は、大事にしていることの一つです。「知っていても実践しないのでは、真の知とは言えない」という意味の言葉で、これを実践できるのは「考え、動き、形にできる人」だと思います。問いを立てることが得意な人、問いを形にすることが得意な人がいますが、研究開発部はその両方に向き合える人が活躍する組織です。
 
例えば、機械学習の領域において高い精度を求められることがありますが、今あるデータで出せる精度には限界があります。今出せる精度があったとして、どうすればその先を作れるか。求められる高い性能を実現するために、ユーザー体験にまで踏み込んで考え、提案し、議論を重ねる中で本当に作るべきものが見えてくるのだと思います。このような動きができないと、活躍が限定的になってくると思います。
 
DSOC OCRの開発で活躍しているAutomation Groupに所属する高際睦起という研究員がいます。彼が書いたコードを読んだ別のメンバーが「コードを読めば理解できるが、なぜそこにその変数を置いたのかが分からない」と話すとおり、優秀な研究員ではあるのですが、別のメンバーは「そこまでやるのかと思った」と言っていました。この話から、DSOCにおけるR&Dにおいて必要なこととして一種の「コツコツ」型の取り組みが求められていることを感じました。細部にこだわり、それを結果につなげる。そういう仕事を評価していきたいと思っています。
これからどのような取り組みをしていきたいですか。
永井
これまで10年以上もの歳月をかけて名刺のデータ化に取り組んできた蓄積は、私たちの事業の根幹となる名刺のデータ化の精度を維持し、高めていく取り組みに大してもちろん有用ですが、それだけではありません。名刺以外の請求書や契約書といったビジネス書類、人事情報など各種のビジネス情報をデータ化し、整理・活用する取り組みにおいても有効です。
 
また、SocSci Groupの研究員が「出会いのデータベース」に向き合い生み出してきた、研究成果を論文やDSOC Data Science Reportといった形式で発表してきました。こういった取り組みが発展し、DSOCでEBPM支援室という組織が2020年10月に立ち上がりました。この組織が立ち上がったことも、これまで研究員が取り組んできた研究成果の一つだと考えています。
 
DSOCが持つ優位性の一つに、一般的に誰もがやりたがらない仕事、つまり名刺のデータ化という一つのことに向き合い続けたトライ&エラーの経験を巨大なデータの蓄積として持っていることが挙げられます。このデータを活用してあらゆるビジネスデータの価値を引き出すことが、今後の取り組みにおける大きな狙いです。
 
Sansan株式会社は、1年後のサービスの在り姿ですら想像することが難しいくらいのスピードで変化、成長してきました。その中で、DSOC はデータ化、データ整理のための技術開発で会社を支えてきました。支えることは、引き続き私たちにとって最も重要なこととしてあり続けますが、これからさらに力を入れるのはデータや技術への向き合いを通して、あらゆるビジネスデータの価値を引き出し、Sansan株式会社が提供するサービスの未来に今以上に影響し、それをリードする存在となることです。それがやりたいことであり、求められていることだと考えています。


DSOC RECRUITMENT
Data Strategy & Operation Center

DSOC RECRUITMENT
Data Strategy & Operation Center