法律情報がデジタル化され利活用性の高いかたちであらゆるユーザーに行き届く環境をつくる
――設立経緯を教えてください。
八木田:東京大学大学院コンピュータ科学専攻で、「自然言語処理やグラフ理論を用いた判例の類似性計算」を修士論文のテーマにして研究を進めるうち、「法律業界への技術の浸透はこれから。コンピュータ科学の技術を社会還元できる余地が大きい」ことを確信しました。ベンチャー企業でのインターン経験を経て、大学院修了後、大学・大学院の同期だった城戸とともに当社を設立したのが2017年。城戸は開発、私はそれ以外すべての業務、のちに参画した津金澤は事業統括と、役割分担して運営しています。
――どのようなサービスですか?
八木田:「Legalscape(以下LS)」は、弁護士や法務担当者が各種リサーチを行う時、高度で複雑で、しかも相互に関連する法律情報――法令、判例、パブリックコメント、ガイドライン、ニュースレター、法律関連の書籍・雑誌など――に、Web上で一元的にアクセスできる“次世代型の法律情報検索・閲覧システム”です。法律相談に回答する際など、資料集めに膨大な時間がとられて大変だという話を何度も聞きました。そこで私たちは、そういった法律情報をLS内に収録し、書籍や法令などの引用文献・関連文献をリンクさせてWeb上で自在に行き来できるようにしたり、閲覧中の文献を参照したほかの文献を検索できるようにしたり、法律文書を解析・構造化することでキーワードによる検索精度を高めたりと、「必要な情報を素早く正確に洗い出し、絞り込みたい」というニーズに応えるプロダクトを開発し、サービス提供しているのです。
城戸:私たちはWeb上にコンテンツを載せるだけではなく、高度な分析や検索を可能にする=“構造的なデータに変換する”ための研究開発を行ってきました。八木田の述べた機能は、“リーガル・ウェブ”構想(相互につながった状態の法律情報)と呼んでいるもので、当社のコアコンセプトになります。自然言語処理を用いた法律文書の解析・構造化によって、法律情報間の関係性を分析・整理し、自動で法律情報を相互に結び付ける技術で、複数の特許を取得しています。私たちは元々、判決文の構造解析で技術力を蓄積してきましたが、現在は法律の条文や法律関連書籍など、あらゆるコンテンツを対象に“構造化されたデジタルデータへと変換する技術”を進化させ、弁護士や法務担当者の“法律情報の利活用”を支援しています。
――日弁連法務研究財団の「民事判決オープンデータ化検討プロジェクト」にも参加していますね。
八木田:政府による民事裁判手続きIT化の取り組みに合わせて、民事判決を電子化・公開することを検討する、日弁連、法務省が中心となり、最高裁、内閣官房などと連携して推進しているプロジェクトです。民事判決を公開するには、個人情報や秘匿情報の取り扱いが課題でした。それらの匿名加工(仮名化=裁判官が判決書内の人名など固有名詞を伏せ字に置き換える作業)が必要とされていますが、年間数十万件とも言われる大量の判決文すべてを人力のみで匿名加工することは現実的に難しいため、私たちが“判例仮名化”の自動処理の実現性を検証しています。ここに自然言語処理技術を活用することで“人手修正作業”のボリュームを軽減し、現実的にオープンデータ化が可能になると考えています。私たちが、判例など法律情報ドメインに特化し、技術力を向上させながら研鑽を積んできた結果、招聘に値する事業者として選んでいただけたのだと自負しています。このプロジェクトに関しては、技術開発責任者の城戸が中心になって進めています。
加えて私たちは、デジタル庁で推進している「法制事務のデジタル化等に関する検討」プロジェクトにも参加しており、法令のデジタル化にも関与しています。
――御社は、“法律情報ドメイン×機械学習技術”のフロントランナーと言われています。
津金澤:しかしながら、私たちはプロダクトをつくることはできても、リーガル・プロフェッショナルなユーザーではありません。ですから、実務で使っていただく方々から定性的・定量的なフィードバックをいただくことを非常に大切にしてきました。
LSの実用化にあたっては、β版の導入と運用を、森・濱田松本法律事務所に協力いただき、格納コンテンツや機能改善についてアドバイスをもらっています。現在、同法律事務所をはじめとする様々な法律事務所、企業法務部に利用いただいています。“カスタマーサクセス”というサービス改善のための顧客ヒアリングを行う役割のメンバーが主体となって、弁護士や法務担当の「困った」「できたらいいな」を、技術で解決するべく奮闘中です。
――プロダクトの展開予定を教えてください。
津金澤:LSには、法律学者などが著した難解な専門書(基本書など)がかなり含まれるため、“信頼のおける情報源にアクセスしたい”と考える弁護士やベテラン法務担当者の方に喜ばれます。しかし企業の場合、“新卒ですぐに法務部配属”“他部署から異動したばかり”といった法務担当者もいらっしゃいます。難解な書籍が含まれていても、そうした方々にとってもとっつきやすく、かつ使いやすいよう、プロダクトを進化させていきたいですね。
城戸:信頼のおける法律文献に依拠して回答させる、GPT-4ベースのシステム――大規模言語モデル(LLM)の法務領域への応用を通じて、法務担当を想定利用者とするリーガルリサーチ特化型の対話AI――の提供も開始する予定です。
――法律情報がデジタル化され、便利になった先で目指すのは?
八木田:私たちは「すべての法情報を見渡す景色を描き出す」というパーパスのもと、難解で膨大だが紙で書かれた法律情報のデジタル化による利活用性の向上に取り組んでいますが、単にPDFを量産するようなデジタル化だと、情報量が膨大になり過ぎるだけで、埋もれる情報が出てきたり、情報の選択が困難になるといった事態が起こり得ます。そうした懸念については、城戸の申した構造化技術やリンク付与技術、また、大規模言語モデルの応用なども行うなど、私たち独自の技術力で解消していくことが、“フロントランナー”としての務めだと考えています。
例えて言えば、私たちの仕事は、弁護士や企業法務担当者といったプロフェッショナルの方々が料理をする際に、まな板の上に、瞬時に必要な食材を載せる――ということ。適切な食材をまな板に載せるまでの労力を小さくできるので、“料理人”は、どう料理するか?といった専門性の高い仕事に注力できるようになっていくはずです。
今は企業法務領域で、リーガル・プロフェッショナル向けにプロダクト開発・提供を行っていますが、日本は法治国家である以上、もっと幅広い領域や対象に展開していきたいと考えています。将来は裾野を広げ、総務や人事、さらには国民一人ひとりが利活用できるプロダクトに育て上げたいと思っています。そこに到達するまでにどれだけの時間と努力を要するかわかりませんが、法治国家における根幹をなす法律情報がデジタル化され、なおかつ利活用性の高いかたちであらゆるユーザーに行き届く環境をつくることが理想です。民事判決のオープンデータ化に代表されるような国家的なプロジェクトにも参画しつつ、日本が法律情報を次代にきちんと届けていけるよう、当社が率先して取り組んでいきたいと思います。
私たちは今まさに、プロダクトの改善スピードと事業拡大を加速させています。それに伴うプロダクトの機能改善やコンテンツ開発はもとより、当社自体の法務機能の立ち上げも急務です。実務に精通した弁護士の採用を検討するなど、組織力の強化もぬかりなきよう、メンバー一丸となって走り続けています。