僕は祈る

僕は神を信じるものではない そして僕は祈り続ける。
今年の夏はいつにもまして暑い。去年も暑かったように思ったがこんなに暑かったかな。

広島の8月6日はいつも暑い。
そして一年がたっていく。

子供のころは少しづつ世界はよくなっていくとなんとなく思っていたけれども、
思わぬところで思わぬ形で戦いが続いていき、それに対して絶望的な気持ちになるもんだな。

少しでも世界が穏やかになりますように。
戦いで傷つく人がいなくなりますように。

ガートナー、2024年以降のソフトウェアエンジニアリングに関する戦略的テクノロジトレンドのトップ5を発表

ガートナーが戦略的テクノロジトレンドのトップ5を発表したとCodeZineがのべている。
その5つが

  • ソフトウェアエンジニアリングインテリジェンス
  • AI拡張型開発
  • グリーンソフトウェアエンジニアリング
  • プラットフォームエンジニアリング
  • クラウド開発環境

であり、GPTに聞いた結果が下記のとおり。

ソフトウェアエンジニアリングインテリジェンス:
ソフトウェアエンジニアリングインテリジェンス(Software Engineering Intelligence)は、ソフトウェア開発プロセスにおけるデータ分析やAIを活用して、開発の効率や品質を向上させる技術や手法を指します。開発プロジェクトの進捗やリスクをリアルタイムで把握し、最適な意思決定を支援するためのインテリジェンス技術が含まれます。

AI拡張型開発:
AI拡張型開発(AI-augmented Development)は、AI技術を利用してソフトウェア開発プロセスを補助・自動化する手法です。コード生成、バグ検出、最適化など、開発者が行う作業をAIが支援することで、開発効率や品質が向上します。

グリーンソフトウェアエンジニアリング:
グリーンソフトウェアエンジニアリング(Green Software Engineering)は、ソフトウェアの開発や運用において環境への影響を最小限に抑えることを目指すアプローチです。エネルギー効率の良いプログラミング、リソースの最適化、カーボンフットプリントの削減などが含まれます。

プラットフォームエンジニアリング:
プラットフォームエンジニアリング(Platform Engineering)は、ソフトウェア開発チームが効率よくアプリケーションを開発、デプロイ、運用できるようにするための共通基盤やツールを構築する技術です。これにより、開発者は基盤を利用して素早く安全にアプリケーションをリリースできるようになります。

クラウド開発環境:
クラウド開発環境(Cloud Development Environment)は、クラウド上でソフトウェアの開発、テスト、デプロイを行う環境を指します。開発者はインターネット経由でアクセスできるリモートの環境を利用し、リソースのスケーリングやチーム間でのコラボレーションを容易に行えます。

クラウドはもはや必須だとして、AIに助けてもらいながらソフトウエア開発するのはもはや当たり前ですね。
プラットフォームエンジニアリングには興味がありますが、グリーンを意識して実装やら アルゴリズムを考える時代になるのかしら。

AIにblogを書いてもらった

新年あけましておめでとうございます!
AIにblogの内容を提案してもらいました。

2024年はますますAIの利用が促進される年となることが予想されます。

AI技術はますます進化し、私たちの生活やビジネスに大きなインパクトを与えることでしょう。

自分も遅れずにサービスや技術のキャッチアップを行いたいと思っています。AIを活用することで、業務の効率化や生産性の向上が期待できます。新しいサービスや技術を学び、取り入れることで、自分自身の成長やキャリアの発展にもつなげることができるでしょう。

ただし、AIの利用には注意が必要です。データの流出や蓄積に関しては、注意深く対応する必要があります。個人情報や機密情報の適切な管理が求められます。

今年はAIのさらに発展し、加速する一年となると思います。

自分自身の成長と共に、AIを上手に活用していきましょう。新しいサービスや技術へのキャッチアップを進めつつ、データの管理にも十分に注意を払いたいと思っています。

また、職場でも大いに生成AIを中心とした人工知能の技術を使っていくようにしたいと思います。

みなさんも素晴らしい2024年をお過ごしください!

2024 謹賀新年

2024年がスタートしました。
今年は4月から、個人的にも研究室的にも大きな変化があります。
この変化をうまくとらえて飛躍の年にしたいと思っています。
どうぞよろしくお願いします。

献本御礼: 設計論

amazon 設計論

素晴らしい本が手元に届きました。
その本を手に取るだけで、その圧倒的な存在感が伝わってきます。
「設計論」、このタイトル自体が強烈なインパクトを持っています。
正確な言葉で表現するのは難しいですが、それはまさに衝撃的で、感動的でした。

この本の分厚さからくる情報量は、一度に全てを消化するのは困難ですが、著者の深遠な歴史と経験が感じられました。
また、現在進行中の私のプロジェクトに対しても非常に関連性がある部分があり、私の学びに大いに役立ちました。

もう少し勉強せねばなりません。
オイラもがんばらないとな。

(この文章はchat GPT4.0の手助けを借りています)

医情報学科 設置の趣旨

医情報学科では、今後の飛躍的発展が期待できる生命科学分野と、工学の中でも特に電気、電子、情報分野の融合科学技術領域の基礎、応用を体系的に学習し、幅広い知識と問題解決能力をもつ専門技術者や研究者を養成すること。具体的には、生物機能とエレクトロニクス及び情報技術の融合を図り、生命システムを理解して科学技術に応用すること及び生命システムを工学分野における技術により支援することを目的とし、生体情報の理解に重点を置くバイオインフォーマティクス、脳科学分野、生体情報の取得・制御に重点を置く生体計測、医用機器分野などを柱に据え、教育研究を行うこととした。

同志社大学が行われているAI・データサイエンスプログラムの一つであるDDASH

同志社大学は2022年度から「同志社データサイエンス・AI教育プログラム(DDASH)」を開始しました。
DDASHとは「Doshisha Approved Program for Data Science and AI Smart Higher Education」の略で、数理、データサイエンス、AI分野の人材育成を目的とした教育プログラムです。
DDASHは大学全体で数理・データサイエンス・AI教育を推進しています。

具体的には、以下の3つのレベルに分けてプログラムが提供されています:

  • リテラシーレベルのDDASH-L(2022年度開始):全学部の学生を対象としており、それまでの同志社大学のデータサイエンス教育の実績を踏まえた全学レベルの教育プログラムです。全ての学生が履修可能で、複数の学部が協同して教材を作成します。また、全ての学部から教員が参加するワーキング・グループでプログラムの点検・検討を行っています。
  • 応用基礎レベルのDDASH-A(2023年度開始予定)
  • それらを包含するDDASH副専攻(2023年度開始予定

DDASHは文部科学省の数理・データサイエンス・AI教育プログラム認定制度(リテラシーレベル、応用基礎レベル)に準拠しています。
また、DDASHは大学院レベルでの展開も予定しており、すでに「Comm 5.0 AI・データサイエンス副専攻」を開設しています。
これにより、データサイエンス・AIを駆使して世界で活躍できる人材育成を目指しています​。

(この文章はchat GPT4.0の手助けを借りています)

AppleのVR/AR ヘッドセット登場

Appleが革新的なARヘッドセットをリリースしました。
私がこのヘッドセットについてのニュースをキャッチした時にMetaが提供する製品とは全く異なる製品であると感じました。
しかも、その消費対象となっているのが、我々一般大衆なのかさえ疑問を感じます。

NBAの試合や相撲などのスポーツイベントを考えてみてください。それぞれには、コートや土俵近くのプレミアムシートを確保できる特定の観客が存在します。また、クラシック音楽のコンサートでも、これと同様の特権を享受しているおそらくいくつかの人々が存在することでしょう。
特定の客がその場の独占的な体験を享受するという現象が、これからさらに洗練された形で現れるかもしれません。

映画の領域でも、新型ヘッドセットを所有するユーザーに対して独占的に提供されるサブスクリプションサービスの登場を予見しています。
ここでのキーテクノロジーとなるのは、位置センサー、ミリ波レーダー、そして空間オーディオだと思われます。これらの技術を活用して、バーチャル空間上で具体的な座席を指定するようになるでしょう。
さらに、ユーザーの脳波や生体情報といった詳細な情報が取得されることも予想されます。

これは、一部で話題の「メタバース」のような曖昧な概念を超えて、より具体的で戦略的な新市場の創造を示唆していると感じます。

いかがでしょうか?

身体性について

春学期の科目、”赤ちゃん学”は、いくつもの素晴らしい発見と共に、新しい教育の形が感じ取れる。
この授業では、板倉先生、加藤先生、元山先生をはじめとする豊富な経験と知識を持つ講師陣が深い洞察力と献身的な指導を提供している。
私たちが共有する知識は年々増大し、それは我々自身の学びの体験を新たなレベルへと押し上げている。

この授業では、人間という生命体が成長し発達する様子を見つることも一つの視点として提供している。
それは私たちが生まれながらに持っている能力と可能性について深く考察するきっかけとなり、我々が理解する人間の本質を更に掘り下げる手助けとなっている。
また、まだ言葉を話せない赤ちゃんを対象とする研究の難しさも学んできた。それは言語を超えてコミュニケーションを理解するための新たな視点を提供し、子どもの心と行動を理解するための異なるアプローチを必要とする。

AI技術の進歩、特にChatGPTの出現は、我々の知識の深化に貢献してきた。
その能力と柔軟性により、AIは学問の世界に大きな衝撃を与えてきた。
現在、ChatGPTはウェブ上のデータを入力として使用しているが、これは人間が学習と経験を通じて獲得する情報の一部を表現しているだけである。

「身体性」というキーワードは非常に重要である。
私たちは身体を通じて世界を理解し、感じ、経験する。
それは私たちが認識し、思考し、行動する方法に深く影響を及ぼしている。
この問題については、更なる時間と考えを費やす必要がある。
しかもできるだけ早くだ。
(この文章はchat GPT4.0の手助けを借りています)

就職後3年以内離職率の推移

よく話題になるのでメモしときます。
新卒学生の早期離職率についてです。

私自身も経験者の一人として、新卒の若者たちが企業を早期に去る傾向が増えているように感じています。
しかし、この体感は本当に事実を反映しているのでしょうか?
まず、この疑問に答えるためにはデータを確認することが重要です。私たちは時々、私たちの体感が事実を正確に反映していると思い込みがちですが、それは必ずしも真実ではないことを忘れてはなりません。

これは厚生労働省の提供するデータです。
厚生労働省 データ
これによれば、過去30年間で新卒学生の3年以内の離職率は約30%で、それほど大きな変動は見られません。
これは一見驚きかもしれませんが、事実、我々の直感や体感がデータと一致しないことはしばしばあります。

では、なぜ我々は新卒学生の早期離職が増えていると感じるのでしょうか? それはおそらく我々が直接経験する、あるいは目の前で起こる出来事に影響を受けやすいからかもしれません。一部の新卒学生が早期に退職することが多い場合、それが全体的なトレンドとなっていると誤解してしまうこともあります。
新卒学生もまた、仕事を探す際の価値観や希望、不安など、多くの面で以前と大きな変わりはないかもしれません。

体感とデータが一致しないとき、それは新たな視点や学びの機会を提供してくれます。私たちは、事実と情報に基づいた意思決定をすることで、より良い組織運営、そして新卒学生を含む全ての従業員の満足度と生産性を向上させることができます。

(この文章はchat GPT4.0の手助けを借りています)

OpenAIの著作権について

chatGPT-4と対話しました。
メモ。

OpenAIのGPT-4におけるテキスト生成の著作権と利用規約

  • OpenAIはGPT-3までの出力の著作権についてユーザーに帰属すると明確に表明しているが、GPT-4についての具体的な情報は不明。
  • GPT-4によって生成されたテキストの使用に関しては、OpenAIの利用規約に従う必要がある。具体的な規定や条件はOpenAIの公式ウェブサイトや利用規約の文書で確認できる。GPT-3までの利用規約では、生成されたテキストの著作権はユーザーが所有するとされている。GPT-4についても同様の方針が適用されると考えられるが、最新の情報や詳細についてはOpenAIの公式ウェブサイトで確認することが推奨される。
  • OpenAIの公式ウェブサイトのURLはhttps://www.openai.comであるが、特定のUse Case Policyページを開くことはできない可能性がある。この問題は一時的な接続問題やページが非公開になっているためである可能性がある。

chatGPT-4の生成した文章を使った場合、OpenAIの著作権に抵触することがありますか?

OpenAIはGPT-3の利用者が生成した出力の著作権について明確に主張していません。しかし、基本的にはユーザーが生成した出力(GPT-3が生成したテキスト)の著作権はユーザーに帰属するとされています。ただし、これはGPT-3の利用規約に基づくものであり、GPT-4についての具体的な情報は私の知識データベースの更新(2021年9月まで)以降に公開される可能性があります。

OpenAIのGPT-4は、GPT-3.5と比較して進歩した推論能力を持つ最新のモデルです。GPT-4はより広範な一般知識と問題解決能力を持ち、より困難な問題をより正確に解くことができます。また、より創造的で協調的で、創造的なタスクや技術的なライティングタスク、ユーザーのライティングスタイルの学習などに対応します​1​​2​。

GPT-4はGPT, GPT-2, GPT-3の研究の軌跡を辿っており、より多くのデータと計算を利用してますます洗練され、能力のある言語モデルを作り出しています。OpenAIは、GPT-4を作るために6ヶ月を費やし、不適切なコンテンツへの応答を82%減らし、事実に基づいた応答を40%増やすことを達成しました​3​。

GPT-4の開発には、人間のフィードバックが大いに活用されています。ChatGPTのユーザーからのフィードバックを含む多くの人間のフィードバックを取り入れて、GPT-4の振る舞いを改善しています。また、AIの安全性とセキュリティを含む領域での早期フィードバックのために50人以上の専門家と協力しています​4​​5​。

さらに、GPT-4はMicrosoft Azure AIスーパーコンピュータで訓練され、AzureのAI最適化インフラストラクチャが世界中のユーザーにGPT-4を提供することを可能にしています​6​。

OpenAIは、AIが全ての人類に利益をもたらすことを確保するという使命の一部として、モデルの責任ある開発、展開、使用を確保することを目指しています。具体的には、ツールの使用を監視し、モデルのリスクと能力について学んだことに基づいて安全対策を更新します​7​。

しかし、GPT-4にはまだ解決すべき多くの問題があります。社会的なバイアス、幻覚、敵対的なプロンプトなどがその一部です。

OpenAIは、モデルの限界を克服するために、透明性の推進、ユーザー教育、そして広範なAIリテラシーを促進しています。また、人々がモデルの形状に影響を与える入力の方法を拡大することを目指しています​1​。

OpenAIの原則は、ハームの最小化、信頼の構築、学習と反復、そして信頼と安全性の先駆者であることを含みます。これらの原則は、モデルの安全な使用と向上に貢献します​2​。

OpenAIはまた、GPT-4を使用していくつかの革新的な製品を作り出す組織と協力しています。これらには、Duolingo(GPT-4が対話を深める)、Be My Eyes(GPT-4が視覚的なアクセシビリティを変革)、Stripe(GPT-4がユーザー体験を合理化し、詐欺を防止)、そしてMorgan Stanley(Morgan StanleyのウェルスマネジメントがGPT-4を活用してその広大な知識ベースを整理)が含まれます​3​。

GPT-4は、ChatGPT PlusとAPIとして利用可能で、開発者がアプリケーションやサービスを構築するために利用できます​4​。

chatGPT-4の生成した文章を私が使った場合、OpenAIの著作権に抵触することがありますか?

OpenAIのGPT-4によって生成されたテキストの使用に関しては、OpenAIの利用規約によります。具体的な規定や条件はOpenAIの公式ウェブサイトや利用規約の文書で確認することができます。

しかし、OpenAIのGPT-3までの利用規約では、GPTによって生成されたテキストはユーザーが所有すると明記されています。このため、GPT-4についても同様の方針が適用されると考えられます。ただし、最新の情報や詳細についてはOpenAIの公式ウェブサイトで確認してください。

該当するOpenAIの公式ウェブサイトのURLを教えてください。

申し訳ありませんが、OpenAIのUse Case Policyページを開くことができませんでした。これはページが非公開になっているか、または一時的な接続問題である可能性があります。しかしながら、私の知識の範囲内で回答すると、OpenAIのGPT-3やそれ以前のモデルについては、生成されたテキストに対する著作権はユーザーに属するという方針でした。GPT-4についても同様の方針が適用されると考えられますが、これは確定的な情報ではなく、最終的な解釈はOpenAIの公式ガイダンスによるものです。

公式ウェブサイトで最新の情報を確認することをお勧めします。以下にOpenAIの公式ウェブサイトのURLを提供します:

OpenAI公式ウェブサイト

生成系AIについていいたいことあれこれ

memo

・良心(システム1)と良心(システム2)
・汎化と特化
・正確ではない情報が含まれるということ
・生成のコスト、評価のコスト
・探索・探査と生成
・幻覚効果(Hallucination)
・アルゴリズムとデータ
・良心システムを設定すること

LLMにおけるデータのもつ課題

執筆中

参考

3. 「日本語に特化した言語モデル」が直面する言語固有の課題
なぜ英語圏や中国語圏の汎用的な大規模言語モデルと比較して、日本語に特化した汎用的な大規模言語モデルが小規模に留まっているのでしょうか。これには、日本語固有の課題や難しさがあります。 最初の課題として、これまで言語モデルで日本語を使用する際、コーパス(と呼ばれる自然言語の文章を構造化して大規模に集め、品詞等の言語的な情報を付与したもの)が少なかったり、例えあったとしても、テキスト内にノイズがたくさん存在しているため、使用する際に上手く除去しなければいけませんでした。

また、インターネット上のテキストはウィキペディアのコピーが多く、教師データとして適切なものが少ないということもあります。共通語である英語であればデータ量もさることながら、研究者同士のつながりで質の良いデータが共有されることに対し、日本語はこれと比較して、データ量・研究者間のデータ共有数ともに量は多くありません。

さらに日本語独自の難しさとして、以下が挙げられます。

日本語は語順の自由度が高いことや、日常における必須語が多い。
さまざまな表記や同じ音で異なる語が存在する。
方言の多様性で同じ意味の単語でも日本全国で異なる単語の組み合わせになる。
日本語の話者はひらがな・カタカナ・漢字・ローマ字など、さまざまな文字を使って1つの文章を作り、同じ単語を複数回表記する場合には書き方を変える。
日本語の話し言葉は文中の主語や目的語を省略しがちなので、テキストを読む際には、その文中の単語の省略を考慮しながら意味を解釈していく必要がある。
日本語に特化した汎用的な大規模言語モデルが作られれば、これらの問題を解消することができ、さらに日本語の会話や文章を正確に推定することができるようになります。

NTTデータ

参考2

大規模言語モデルをだます Hindsight Neglect タスクとは