靴下占い / 医学教育とクロスワード / 論理的思考 / 効率性 / AIの効率性 / クッキー缶
目次
靴下占い
診察でベッドに横になってもらう事が多いのですが、その時に履いている靴下は否応なしに見えますよね?するとその個性に驚くわけです。
だから他院との差別化に「靴下占い」をしたらどうだろう、と思いつきました。

早速患者さんに「靴下占いをしましょう、その靴下はどこで買いましたか?」と言ってみた。
靴下にもフォークロアという分類があるのかどうか知らないのですが、その人の靴下はフォークロア調と言って良いおしゃれな柄。
「何がわかるんですか?、靴下屋さん(という名のお店がある)で3足1000円ぐらいです」と彼女は言い、もう騙される気満々、というか、とても聞き上手な方のようです。
「え?そんなに安いのも置いてありますか?」と、早速会話が逸れます。
「ありますよ」
「靴下はどう選びますか?靴下で、その日の気分だとかが分かるんじゃないかと思うんです」すでに占いを忘れて、単なるインタビューになっています。
「まず洋服を選んでからそれに合わせますから、たしかに気分を反映するかも」
「そうかもですね、ミニオンズのかわいい靴下とか履いている人がいると、推し?って思ったりしちゃいますし、それが『子供からもらった』だと、ほのぼのします。単色、動物もの、キャラクター、模様などなど、その人の嗜好がわかって面白いんですよー」
「私はどうでしょうか」
「オシャレに気を遣っているのはわかりますし、病院だから高いの履いてこないのは正解だし、今日の気分が悪くないのもわかります」
「前回来てから、症状はだいぶ落ち着きました」
インタビューの一つのきっかけぐらいにはなりそう。
「自分自身は一張羅の靴下があって、それはデザイナーが作ったみたいなやつですが、編み方がだいぶ独特で、お高いですが、うんと気分が良いときに履きます」
「それは履き心地は良いんですか?」
「ゴツゴツして、靴を履く時はあんまり。家の中にいるとき履く感じでしょうか。履き心地関係なく妙にお気に入りの靴下ってありませんか?」
「あるかもしれませんね」(こういう返答の仕方といい、やはり聞き上手)
「でも、この靴下お気に入り、と自覚するのは1年後だったりして、もうどこで買ったか忘れたりしているのが困る」
「笑」
靴下をきっかけに聞き上手の人と話しました、みたいなエピソードになりました。
以前、人に勧められて、妙に高い靴下を買ったことがありますが、履き心地が悪く驚きました。あとで雑誌で「この靴下がすごい」と評価されていたけれど、異を唱えたくはなりました。
いくら編みが優れていようがこの形で心地よいはずがないのになんで買っちゃったんだろうな?と反省しましたが、勧めた人は良いと思ったから勧めたはずです。
それだけ靴下は個性そのものかも、そう思ってまた違う人に「どうやって靴下選びます?」と聞いたところが「考えたことない、ユニクロ一択」と反応されてしまいました。ふむ、明日出直しましょう。
医学教育とクロスワードパズル
自分が医師になる過程でクロスワードパズルを課された記憶はないのですが、かなり普遍的な事実として「医療専門職を教育するのにクロスワードパズルは役立つ」とされているらしい。システマティックレビューが出来るくらいに。
Evidence-Based Crossword Puzzles for Health Professions Education: A Systematic Review
論文の概要:
この論文は、医療専門職教育におけるクロスワードパズルの使用に関するシステマティックレビューです。29の研究を分析した結果、以下のことが明らかになりました:
- クロスワードパズルは学生にとって楽しい学習活動である。
- 多くの場合、客観的な知識テストのスコアが向上した。
- 学生自身も学習効果を実感している。
- グループでの使用や競争要素の導入が効果的である可能性がある。
- クロスワードの構造や実施方法は研究によってさまざまだった。
この研究の意味と普遍性:
このシステマティックレビューは、医療教育におけるゲーミフィケーションの一形態としてのクロスワードパズルの有効性を示唆しています。しかし、これらの結果を普遍的な事実として受け取るには慎重である必要があります:
- 文化的差異: 研究の多くがインドや中東で行われており、異なる文化圏では結果が変わる可能性があります。
- 教育段階による違い: 多くの研究が学部生を対象としており、より上級の学習者では効果が異なる可能性があります。
- 長期的効果: 多くの研究が短期的な効果を測定しており、長期的な知識の定着については不明な点が多いです。
- 他の学習方法との比較: 一部の研究ではクロスワードよりも効果的な方法が示されており、常に最適な方法とは限らないことを示唆しています。
クロスワードパズルで何が鍛えられるのか
この論文から医師や医学生について以下のような興味深い洞察が得られます:
- 学習への積極的な姿勢: 医学生は、クロスワードパズルのような学習方法に前向きで、楽しみながら学ぶ姿勢があります。これは、難しい医学知識を習得する上で重要な特性です。
- 協調性と競争心のバランス: 研究結果から、医学生はグループでの協力学習を楽しむ一方で、競争的な要素も学習意欲を高めることがわかりました。これは、チーム医療と個人の専門性向上の両立が求められる医療現場では重要です。確かに医学生は本当に競争が好きだなと実感することあります。
- 創造的思考力: クロスワードパズルの解答には、与えられた情報を組み合わせて答えを導き出す創造的思考が必要です。これは複雑な症例に対処する際の診断能力にもつながるはずです。
- 言語能力の重要性: 医学用語や専門知識を言葉で正確に表現する能力が求められます。これは患者とのコミュニケーションや医療記録の作成に不可欠なスキルです。インドや中東では医学を英語で学習している事が多く、外国語で医学を取得する時に役立っている可能性はあります。日本は母国語で医学が習得できる稀有な国の一つですが、世界標準としての英語で学習する日が来た時にこういうゲーミフィケーションはあり得るかもしれません。
- 生涯学習への意欲: 医学生が新しい学習方法に興味を示すことは、常に進歩する医学知識に対応するための生涯学習の姿勢につながるでしょう。
- 多様な学習スタイルへの適応: 研究では様々な形式のクロスワードが検討されており、医学生が多様な学習方法に適応できることを示唆しています。
- 批判的思考力: 一部の研究では、クロスワードよりも他の学習方法が効果的だったという結果も示されています。これは医学生が単に楽しいだけでなく、効果的な学習方法を批判的に評価する能力を持っていることを示唆します。
彼らは全体的に能力が高い人々です。以前から紹介している「観察を鍛える」「自ら問いを立てる」「グループ学習」など、医学生向けの特別な勉強方法の他に語彙を鍛えるためのクロスワードパズルも有用というのは興味深い結果でした。
医師の仕事の本質との関連:
この研究結果は、医師の仕事の本質的な側面をいくつか反映しているでしょう:
- 生涯学習: 医学は常に進歩する分野であり、新しい学習方法に適応する能力は重要です。
- 問題解決能力: クロスワードを解く過程は、断片的な情報から全体像を把握する診断プロセスに似ています。
- 協調と競争: 医療現場ではチームワークも重視されますが、個人の専門性向上も求められ、そのスキル向上、競争心は改めて注目されるべきです。
- 言語能力: 正確な医学用語の使用や、患者とのコミュニケーションにおいて言語能力は不可欠です。
- ストレス管理: 楽しみながら学ぶ能力は、ストレスの多い医療現場で重要なスキルになり得ます。ゲーミフィケーションは大切です。
医師は「Wordle」のようなゲームも夢中でやる傾向があるなあと、周囲を見回して思っていましたが、言語能力が高く、競争好きという特性を持つ人々が多いという事実はあるように多います。
「論理的思考」について
論理的思考という言葉はバズワードであって、それ自体何の意味も持たないというか、どうでも良いような気はするんです。本屋で「論理的~」と題名についている本があったら絶対買わない。
何がきっかけか残念ながら忘れてしまったのですが、渡邉雅子さんの『「論理的思考」の社会的構築』(2021)という本を読みました(例外的に買いました)が、この「論理的思考」にはきちんと定義がなされていて大丈夫な(バズワードじゃない)やつです。この本のおかげで自分がよく使う修辞法(ディセルタシオンというらしい)が理解できたのです。
自分は医学が専門ですが、医学ではいろいろな価値観がぶつかり合って正解がないので、まずは問いを定義し、意見を複数述べ、できればそこから新しい結論を引き出す事が良いんじゃないかしら、と思うのですね。一生懸命自分なりに構築してきた論証方法が結果としてフランス流の文章の書き方に似ているとは嬉しい気分です。自分の考え、と主張せず「古典に書いてあるじゃん?」を多用するのも似ています。自分の場合、思いついたアイディアについて、似たようなことはどうせ古典に書いてあるだろうと調べます。弁理士のように。たいてい見つかりますから、古典を最初から知っていたという体で文章を書いてしまいます。「おれ思いついちゃった」と書くより「プラトンがこう言っている」と書いた方が頭がよさそうでしょう?思いついたと言っても、誰かから教わったのに忘れているだけかもしれません。ただ、なるべく「誰々さんから聞いた話で」と、覚えている限りはきちんと表現するように心がけています。
そんなこんなで、ある程度文章は書くことができますが、きちんと修辞法のトレーニングを受けていない劣等感はあるので、若い頃にフランス留学しておけば良かったです。
自分の同級生に赤堀毅さんがいます。外務省外務審議官なのですがフランス国立行政学院を卒業しており、いつかインタビューで「外務省で1番のフランス語つかいを目指している」と語っていたのが格好良くて憧れています。彼が外交の場にいることで安心感があります。ちなみに中満泉さん(国際連合事務次長)と赤堀さんは一緒に模擬国連に参加した仲だと聞きました。やはり志がある人は若いころから違う!
さて自分はこの本を読んだ時に自分の修辞法が理解できて良かった、と思いましたし、そもそも考え方や書き方に優劣をつけるための本じゃないという事は終始著者も書いていた(単なる比較文化論)ので、素直に「ああ良かった」で終わったんですけど、そうでもない反応をする人もいました。マウントを取られたように思ったのか、あるいはこの本を世界におけるコミュニケーションの作法本だと感じたようなのです。著者はすでに海外とよくコミュニケーションしているとか、レトリックに興味がある人を対象にし、気づきを与えられれば嬉しいと書いています。それはその通りで、この本を読んだからコミュニケーション手法が身につくわけではなく、話している相手の文化背景の理解に役立つ程度です。何かのノウハウ本と考えてしまうと、それは違うかなと思います。
さて渡邉雅子さんは新しい本も出していて、日本、米国、フランスの他にイランの修辞法についてもまとめてあるとのことでした。自分は「なるほど、最終的にイランか!」と納得しました。イランはあらゆる文化の発祥地であるという念持がある国で、外せないでしょう。俯瞰する、が自分のペルシャに対する印象だけど、それが本当かどうかは本を読んでみる事にします。渡邉さん自身は、この4つの国の文章の組み立て方(日本のそれは義理で入れたと思うけれど)でほぼほぼ網羅されたと考えているようで、あとは他の国でもその応用になる、と書いています。宇宙人ともそうかな?
イランは教育レベルがすごく高いという印象があります。夫君が東大地震研に留学しているから、という理由で内視鏡室に来ていたイラン人女医さんと1年ご一緒しましたが、ひっそりとバリバリ勉強している感がありましたし、冷静で、歴史の話になっても昂る事なく俯瞰的に捉えていた印象です。他に何人か革命前のイランで高等教育を受けた人を知っていて、同じように物事を俯瞰し、決して金銭欲とは結びつかないような印象。イランはイスラム文化とは違うんだと言われると確かにそれは感じます。その印象が正しいか、本を読まねば。
さて、渡邉さんの定義する「論理的思考」とは、いわゆる論理学とか記号論とは違い、「あの人の考え方は理にかなっていてわかりやすいよね」と相手に思ってもらえるような書き方、考え方の作法の事です。それが国や文化グループによって違うから「あの人は論理的だね」と言われるかどうかは状況により異なる。外交の世界ではハイコンテクストになりますし、逆にSNSではひろゆきさんのような単純だけど相手の揚げ足を取るレトリックが論理的で頭がいいと思われ人気になるのは納得です。他のインフルエンサーの方々を見ても論理的に正しくはないほうが、コミュニケーションコストが安い、早く燃える、記憶に残る、などの利点があるようで、多用された結果として現在のインターネット文化・経済が成り立っています。
それが良いかどうかは論じませんが、多様な考え方を身につけることは自己の精神の防衛にもなりますし、インターネットでのやり取りとは距離を取って冷静に俯瞰を試みたい人にこの本はおすすめです。

☆
きっかけは「劇団☆新感線」でした。劇団の紹介を見た瞬間「☆」が目に飛び込んでくるでしょう?そしてパパパパっと4−5枚の映像が頭の中に浮かんだのです。自分の場合、記憶力がある程度良いのか、文字を見ると、過去のイメージがいくつか浮かびます。ただそれが何かはわからない(そこまで頭が良くはない)から、イメージが何を指すのかコツコツ調べる作業があります。いまだにわからないのが、それが見えた瞬間伊丹十三監督の事も思い出した事で、なぜなのかまだ考えています。
ところで、過去の記憶のイメージを元に、☆を使い出した日本文化の歴史を辿る、みたいな作業になりました。
以下がその結果です。
考えに考えた結果、自分は「週刊少年ジャンプ由来」を提唱します。さっきフランス風ディセルタシオンを紹介したくせに、ここでは米国風5パラグラフ論法で書きます。
週刊少年ジャンプのロゴデザイン
-
もともと少年ジャンプの濁点の部分は1969年以前〜1982年ごろまで「☆☆」のデザインです。これは「みんなが欲し(ホシ)がる」のゲン担ぎだったといいます。以下の記事は漫画のロゴデザイン史で、永久保存すべき内容です。印刷して保存しておきましょう。(自分自身は漫画って読んで良いものかどうかわからないまま幼年時代を過ごし、特に少年漫画は18歳過ぎてから読んだため、その文化に触れずに育ってしまいました)
1980年〜
-
印刷物に☆がデザインとして登場したのはものすごく古いと思います。アメコミではキャプテンアメリカが象徴的ですが軍のシンボルにも使われて。しかし文字として印刷をするにはフォントとして準備される必要があります。古い邦文タイプライターには☆の文字は探してもありません。それが登場した年代はいつごろかを考えると2バイト文字の出現と同時だろうと思います。日本では1980年代、パソコン用16ビットCPUの普及期に「☆」がSJISのコードで「8199」と規定され、一般的に☆を文章の中で使う事ができるようになったのではないか。ワープロが発売されたのも1980年ごろです。フォントとして登場すると共にジャンプの表紙からは消えていったのは偶然なのでしょうか。自分がデザイナーであれば「☆がコモディティ化したな」と考えて、表紙からは消します。
-
1985年の『聖闘士星矢』のロゴには☆が見られます。
-
幽☆遊☆白書:1990年、冨樫義博先生による日本の漫画。傑作。タイトルを長くしたい、という理由で☆入れた由。これが☆が多くの人が「あ、使って良いのかな」と認知した最初なんじゃないかと思います。冨樫先生はストーリーテラーというか、仕組みづくりというか、ゲームのルール作りの天才で、全然器が違う人という印象です。現在連載中のお話も続けてほしいな。
-
漫☆画太郎:1990年デビュー。1990年は自分もリアルタイムで週刊少年ジャンプを読んでいた時期であり、この人は天才だなと素直に思いました。トーンを使わずにペンで書く作家、というのはそれまでもいたんですが、通常は「絵のうまさを強調するべくあえてトーンは使わない」だったものを、ひたすらナンセンスにふって行くパワーがありました。連載が完結しませんが、たいてい瞬発力がすごいので良し。冨樫先生の☆を見て、良いな!とつけてくれたとしたら嬉しい。
なにしろ400万部ぐらい売れていた週刊少年ジャンプですから、数週間で日本中に「☆は印刷され得る文字だ」という知識は普及したと思うんです。
-
1995年「とってもラッキーマン」のタイトルロゴにも☆あり。
-
劇団☆新感線: 1980年旗揚げ。いつから☆がついたか不明ですが、いろいろ検索してみて1990年以後なんじゃないかなと想像しています。漫☆画太郎オマージュだったら嬉しいです。1990年代から人気と実力を兼ね備えた俳優を客演に迎えるスターシステムが定番です。関係ないけどプロデュースをする細川展裕さんは新宿の「エピタフカレー」のオーナー。
-
スターダスト☆レビュー: 1981年デビュー。いつから☆がついたか不明ですがいろいろ検索するとやはり1990年以後なんじゃないか。これも漫☆画太郎オマージュだったら嬉しいとは思います。赤坂泰彦からは「生まれて初めてコンサートというものを見に行くときには、スターダストレビューのライブを見に行け」と言われるほどエンターテインメント性の高いバンド、とのこと。
-
ちょっと毛色が違うのがTOM★CAT:1985年デビュー。これだけは由来が違うのでは。F-14トムキャットに米軍の星マークがついている事と関係してるんじゃないかなと思っています。キャプテンアメリカ的な。活字印刷された☆という意味ではTOM★CATがオリジナルと言って良いのかもしれません。
-
つのだ☆ひろ:1971年デビュー。初期のレコードはほとんど「つのだ・ひろ」で、1993年にはつのだ★ひろとなっており、その後☆となる。漫☆画太郎オマージュと決めつけてしまいたい自分がいます。
-
遊☆戯☆王: 1996年、漫画連載開始時点で☆あり。当然幽☆遊☆白書のオマージュなんでしょう。連載開始当時「数あるカードゲームの二番煎じかー」と思ったがあれよあれよと人気に。
-
ダンス☆マン:1997年デビュー。「ミラーボール星からやってきた宇宙人」がコンセプトである。そういう人がいたなあ程度の記憶ですが、ラブマシーンはじめ多数の楽曲の編曲を手掛ける。ちなみにこりん星からゆうこりんがやってきたのが2002年。
-
らき☆すた:2004年連載開始。
-
聖☆おにいさん:2006年連載開始。3巻ぐらいまでしか読んでないけど、まだ連載続いていたとは!そのうち作者の中村光さんはジョーゼフ・キャンベルを超えてしまうのだろうか。
-
魔法少女まどか☆マギカ: 2011年、アニメ放送開始。明るいと見せてダーク・ファンタジー。
という事で日本の文化史を辿る感じになってしまいました。週刊少年ジャンプのロゴが、1980年代以後、人々の深層心理に影響を与えた説、自分としては気に入っておりますが、皆さんいかがでしょうか。
効率性
僕は医学の勉強をするとき、それが総合医療とかプライマリケアなど、多くの人々を取り扱うものであればあるほど「いかに効率よく診るか」という視点に立っているか/欠けているかを評価ポイントにしています。例えば総合診療で丁寧な仕事で見事な診断をしました、みたいな内容のものは、たいしたものだけど、普及しないだろうから、そのスタイルに捉われないようにしたい。極論すると、ありふれた症状のケアは、すべて人工知能に担わせるべきです。勉強した内容がそのアルゴリズム策定に役立ちそうだと思えば一生懸命内容を覚えようと努力するし、そうでなければ記憶から消えてもしょうがないと流しています。
今のところまだ万能のコンピューターはないので自分が人工知能として皆さんをアルゴリズムに則り診断をしています。
さて、アルゴリズムに則って正しい診断をするには、そして患者さんの健康にメリットある受診にするには、正確な情報の満遍ない収集が大切です。それを端折ることは出来ないので、当院の診療はとても時間がかかります。ときどき患者さんの「簡単に終わって欲しい」とか「薬だけください」という価値観とぶつかりあうと思いますがご容赦いただきたく。なお本来当院受診のメリットは、来院頻度が多いほどはっきりして来ます。
お薬手帳や、血液検査結果、画像のCD-ROMは患者さんの情報収集の精度が上がります。それ以上にマイナンバーカードで収集できる情報は役立つことを実感しており、ご高齢の方は全員持っておいていただきたいです。
処方情報の正確な共有だけでも非常に精度が上がりますが、最終的には3文書6情報の情報共有が行われれば、多くの医療過誤が予防されます。3文書6情報とは医療機関の間で患者さんの診療前後に関する情報を共有する際に使用される文書と情報の総称です。
3文書は、診療情報提供書、退院時サマリー、健康診断結果報告書を指します。6情報とは、傷病名、アレルギー情報、感染症情報、薬剤禁忌情報、検査情報、処方情報です。
患者さん自身も、それらの情報を常に意識すると間違いのない診断が行われやすいことをご自覚ください。(マイナンバーカードは、それらを意識できない人々を守ることができるセーフティネットとして機能するはずです)受診時に自分の健康について正確に伝えられるようにできるメモを持参される方には敬意を感じずにはいられません。
結論として、勉強に時間をかけるのは診療の効率性を高めるためでなければならないと意識しており、診療に必要以上に時間がかかったら反省し、どうしたらもっと短時間で診られたかと考えつつ診療をしております。3分診療こそ至高みたいに思うわけです。(今は平均15分なので、最高に進化したらあと5倍患者さんが診られる計算です)
効率性(人工知能における:マクロ)
で、人工知能界隈では当然この手の議論(効率性)が行われます。人間が人工知能よりも優れているかもしれないのは二酸化炭素排出量が少ないって事だけなのに、その優位性すら潰そうとしてくるのが辛いことではありますね。
builder.ioでのLLMを使ったサービス開発の実際 - laiso
人工知能を使いこなす上で大切な視点が書いてありますが、仕事で人工知能を使いたい時にはこの手順が今のところは効率的なのではないかという事が言及されています。主に画像処理のプログラミングの話ですが、文字を多く扱う医療AIでも同じような考え方はできそうです。すなわち、
- 最初は既存のLLMsを使用してみる。それで安く出来そうな場合は問題ないわけです。例えばmed gemini(医療専用LLMs)がGoogleからもうすぐ出てくるそうですが、技術力がないメーカーでも、コストに目をつむればある程度「人工知能!」的なものが作れます。 医者としては研修終了レベル。
- コストやカスタマイズ性に問題がある場合は、独自のモデルをトレーニングする。一番ホットな部分ではあって「宝くじ仮説」は後述しますが、その手法を使って小さくて効率的なLLMsを自分で作る手法があります。他にbit数を下げる方法もあります。ここが研究者にとっては今一番競争が激しい部分かなと思います。特定の医師の思考そっくりのLLMsすら作る事が出来ます。 専門医とりました、ぐらいの感じ。
- ここまで来ると当然教師になるデータセットは持っている前提になりますが、この運用の工夫で精度を上げる事が出来る。つまりがん研有明にいるだけで、なんかすごい訓練されてしまう医者、みたいな感じです。
- コードで実装できる個所はプログラミングしておけ。効率化のためには機械学習ではなくて特定のアルゴリズムを走らせる方がいい場合も当然あります。
- LLMsに多くを任せてしまうと、そのバージョンアップに振り回されたり、精度管理に問題が出ますので、頼るべきところのみ頼るべし。医療保険制度や専門医制度が変わるたびに大きな影響を受けている我々と良く似ています。
コストが一番重要ですが、精度の高いデータセットから可能な限りコンパクトなモデルを実装すれば、どのような困難にも立ち向かいやすいという示唆的な内容になっています。
効率性(人工知能における:ミクロ)
ディープラーニングを軽量化する「宝くじ仮説」について
ディープラーニングモデルの開発・導入時、とくに結果の出力にリアルタイム性が求められるようなビジネス現場への実装においては、モデルの精度を保ちつつ、いかに高速処理を実現するかが重要なポイントです。2年前までのデータで作成されています~みたいなのは、なるべく避けたい。
宝くじ仮説とは「学習済みのニューラルネットワーク (original network) の一部に、少量の学習でも元のネットワークの性能に匹敵する部分ネットワーク (subnetwork) が作られている」という仮説のことです。この部分ネットワーク(subnetwork) を「当たりくじ (winning tickets) 」と名付け、これを見つければより小さくて高性能のモデルが実現できるよね、という考えです。
2019年にこの論文を書いた Jonathan Frankle さんが先日来日され、講演会が開かれました。内容は「モダンLLMをゼロから訓練する」です。
-
DBRX モデルの概要: DBRX は、Databricks が開発した 1,320 億のパラメータを持つオープンソースの大規模言語モデル (LLM) です。ちなみにClaude-3 OPUS(かなりすごい)は2兆、松尾研のが100億、サイバーエージェントのが70億、GPT-3.0(まあまあ)が1750億です。サイバーエージェントはたった70億ですがバカにするなかれ、「インターネットおじさん」を良く再現するんだそうです。チューニング次第で人っぽい反応をするにはそれで十分なんです。
-
DBRXでは1,320億のモデルに「専門的な教育」アーキテクチャつまり、小さなモデル (360 億のパラメータ) を付け加える事で、パフォーマンスとコストを最適化します。専門分野のLLMsが小さなコストで出来る。
-
このように Databricks は AI 開発における Return on Investment(ROI)~AIモデル開発における投資対効果~の重要性を強調しています。何兆パラメータと言った「万能」アプローチに頼るのではなく、特定のデータを使用して構築されたカスタマイズされたモデルを推奨しています。
-
モデル開発のフェーズ:DBRX の開発には、事前トレーニング、データ最適化、微調整、および提供の 4 つのフェーズが含まれます。Databricks は事前トレーニングに 12 兆のトークンを使用し、さまざまなデータセットと命令の組み合わせを広範囲に実験して、モデルのパフォーマンスを向上させました。
-
DBRX をスケーリングするには、モデルを数千の GPU に分割する必要がありました。Databricks は複雑な並列処理手法(一回エラーが出ると膨大な計算が無駄になる)を避け、よりシンプルなデータとモデルの並列処理戦略を選択しました。これも肝らしいです。大規模なトレーニング実行中の GPU 障害を管理するためのエラー修正手法を開発しました。実際にはシンプルな手法によってエラー率をすごく下げられたらしい。
-
Databricks は、LM Foundry(もともとよく知られたMosaicLMが作った事前トレーニングのデータですが、Databricksが買収しました) のほか、微調整、評価をサポートするライブラリなど、モデル トレーニング用のオープンソース ツールをいくつか開発して共有しています。また、評価とデータセットの作成のために、Allen Institute や ElutherAI などの組織とも協力しています。つまり誰でも自分のLLMsを頑張れば作る事が出来る未来を目指しています。夢がありますね。
-
サイバーエージェントの発表で、学習が途中で爆発し、上手くいかなくなって頓挫が良く起きて云々、の話が出てくるのですがこれを解決できそうなのがDatabricksのライブラリのようです。
クッキー缶を作りたかった
クッキーが入っている缶になんとなく夢を感じますが、その深層心理には、私が子供の頃には薬が缶に入って配達されていた、という事実があろうかと思います。
薬は湿気を嫌いますから今のようなPTP包装がない50-60年前には、乾燥剤が封入された大きな大きな缶に入った薬が配達されていたのです。もちろん配達が終われば使いませんから、使用後の缶をもらってきていろいろなものを収納するのに使います。このため自宅にはこの「薬の缶」がたくさんあったのですね。
ブリキの缶は大切に使うと何十年も保ち、収納グッズとしてとても便利ですが自分にとって程よい大きさというものはありますね。個人的には、縦13.6×横9.6×高さ5.3cmぐらいの大きさの缶が、積み重ねてよし、小物をいれてよし、邪魔にならないでよしの万能選手です。他にもきっと便利なサイズはあるはずで、思いついたら教えて欲しい。上記は文庫本とほぼ同じです。単行本と同じサイズも良いかもしれないです。
ところで2024年9月に研究会の事務局をする事になってその準備をしています。何か素敵なノベルティが配られたら嬉しいなと思って、「そうだクッキー缶を作れば良いんじゃないか」と思ったんです。中にはクッキー入ってないんですけどね。
ところが以下の理由で頓挫しました。
自分がお気に入りの缶、2つのお店が同じ大きさで「このサイズ、手に入りやすいのでは」と思ったのですが、全く同じ大きさのものは調べても見つからない。意外な事に、「角缶」と呼ばれる製品には、細かい規格がなさそうです。そもそも板金なので自由に作れてしまう、というのが理由でしょう。2つの店が同じなのは発注先が同じというだけなのでしょう。(2つの店はのれん分けみたいな関係性です)
ブリキは自由なサイズで作れるといえば思い出したのがウォータープリーズ(内視鏡用の送水装置)を開発した時のこと。最初に製品の型を作るのに何千万かかかって、みたいな事を躯体担当者が言い出したので、いやそれではデザイン変更や細かいアップデートもできない、既存のケースに入れれば安くできるでしょう、みたいな事を言ったんです。デザインはいいから、と。すると町工場で板金で作る事ができ、これなら初期投資は不要です、で解決したんです。

ほら、秋葉原で電子工作しましたみたいな形でしょう?
逆にAppleのSteve Jobsは、常にプラスチック筐体でデスクトップPCを作る事にこだわったCEOとして知られています。最初はそうだったんですが、1991年か1992年、とうとう側面が金属で出来たQuadraが発売された時、こだわってたんじゃないのか、とJobsの悪口を言うApple信者がいました。当時からインターネットはお行儀が悪かったし、Jobsはまだ神格化されてなかった。でもそれで低価格化したから僕でも買えました。
話を元に戻しますと、大きなロットならば缶のサイズを自分で決める事ができるが、小ロットでは既製品を選択し、それに印刷する事になる、しかし既製品に良いサイズがない。それで頓挫したんです。
しかもオフセット印刷するには最低3000個ぐらい発注する必要がありそう。型押しなんかますます無理でしょう。1つ600円として3000個だと180万円かかってしまいます。気楽には出来ないな、そもそも9月には間に合わないや、という事でお蔵入りしました。
もっと小ロットで直接印刷する技術はありますが、現実にやろうとするとデザインも大変だし、そもそもサイズに納得していない、という事で今のところはしっかり中身も吟味しながらクッキー缶を集めていこうかな、的な方向性になっています。
お菓子缶を作る会社がこうして「当社のお菓子缶を使ってくれているお店はこちら!」と情報提供してくれるのはとても嬉しいですね。
