AIモデルの開発には学習資料となるデータセットが必要不可欠ですが、すでに大規模なモデルはアクセスできるデータのほとんどを食い尽くしており、2028年までにデータを使い果たしてしまう可能性が指摘されています。AIとデータセットの現状について、学術雑誌のNatureがまとめています。
過去10年間でAIは爆発的な成長を遂げており、特に人間の文章を解析してもっともらしい文章を返す能力には目を見張るものがありますが、こうした能力はすべて、インターネット上に存在する既存の文章などさまざまなデータを学習した上で構築されたものです。
インターネット上には膨大な量のデータが存在することは間違いないのですが、研究機関のEpoch AIによると、AIはインターネット上のデータを驚くべきスピードで学習し続けており、そのほとんどを食い尽くしてしまう可能性があるとのことです。
Epoch AIは「2028年頃までに、AIモデルの学習に使用されるデータセットのサイズは、インターネット上に存在する文章の総ストックと同じサイズに達する」と予測。これはつまり、2028年頃までにAIは学習データを使い果たしてしまう可能性が高いということを意味します。データセットが不足することに加え、新聞社などのデータ所有者がコンテンツの利用を取り締まり始め、アクセスをさらに厳しくしているのもAI研究者にとってのハードルとなっています。
こうした問題はAI研究者の間でも認知されており、従来のデータセットを使い果たすことで学習のスケーリングが限界に近づくという法則が語られることがあります。データセットの不足を補うため、AI研究者は学習の方法を変更するなどしてAIの性能向上を模索しています。
*記事全文は以下ソースにて
2024年12月16日 17時00分 GIGAZINE
【超絶悲報】 子育て世帯、ガチでヤバイ事実が判明してしまう・・・・・
【速報】 奈良県知事「高校生らからは『行きたーい』『めっちゃ楽しみ』『奈良にもっと愛着を感じられる』といったリアルな声も届いている」
オーストラリア「捕鯨禁止のせいで沿岸にクジラが増えすぎました…クジラを食べるサメも急増、助けて」
三菱UFJ銀行・半沢頭取が会見へ… 元行員が10数億円相当窃取で
【京都】 「この日本語が読める方はご入店ください」飲食店の貼り紙が物議… 使用言語による“差別”は法的に許容される?
【画像】 ムッチムチのえちえち夫婦、見つかるwwwwwwwwww
【悲報】 パチ○コで「右打ち」を注意された無職(82)、刃物突きつけ「外に出ろ」
バイト先で。俺『時給700円で週5日も入ってるのに、5万もない。こりゃ変だぞ』 → 出退勤をメモすると、トンデモナイ事が発覚して…
11: 名無しどんぶらこ MgIiECK80 2024-12-16 17:31:34
中国に提供してもらえばいいな
111: 名無しどんぶらこ doEwXAdu0 2024-12-16 18:05:24
AI囲碁の場合、現存する有名棋譜をほとんど学習した後は、
AIどうしの対局を、人間でいう5000年分おこない、その棋譜をもとに学習して、
結局は人間が想像もできない手の戦術をあみだした
もう人間じゃ勝てない
>>111
囲碁みたいな碁盤の目の中で規則的にしか動けないものにはaiは強いけどさあ…
115: 名無しどんぶらこ FlyEJwih0 2024-12-16 18:08:41
>>111
それは当たり前だな
盤面が決まってる以上、時間を掛ければ全ての手を計算できるからな
創作物はそうはならない
決まった枠がないからな、君はAIを万能だと思い過ぎ
何なら、AI自身に聞いてみな
人の様な新たな創造、発想は無理だとそくこたえる
>>115
そういう意味で言うと、AIって未解読の言語などの解読の検証などには適してるのよね…
まぁ良くも悪くも人で言うなら、頭でっかちで、肉体を介した経験が薄い存在なのよね
>>122
肉体を介した経験が薄い?
肉体を介した経験が書いてあるかだけの話なのに
頭でっかちどころか頭小さいのはあなたの方みたいだね
>>145
別にそんな難しい話じゃないよ
単純に情報が足りないって話
あなたが「林檎」という言葉で想起される情報と、AIが想起する情報では圧倒的に情報密度が違うって話よ
わかりやすく例だと、味の評価とかは今のAIには難しい
なぜなら、現状機械的に判断するためのセンサーの感度が、人間の感覚器官とは全く異なる原理で動いてるからね
>>155
少なくとも五感を手に入れないと無理だろうな
>>160
そのためには人間の五感を解析する必要があったりするのよね…
これがまあ、難しいのよね…とにかく人間の感覚って機械工学的観点で見ると、鋭敏なんだか、鈍感なんだか良く分からん領域で動いてるからなぁ…
>>166
個体によっても感じ方が違うしな
人間はやべえよ

たばこ代15,000円→1,000円 / 月
174: 名無しどんぶらこ 0YzIn5XZ0 2024-12-16 18:33:24
>>169
しかもそんなガバガバ判定のくせに、個体間である程度の共通認識を学習、習得できるからなぁ…
ほんとどうやってるのやら
162: 名無しどんぶらこ 0t/nEeTK0 2024-12-16 18:29:12
>>155
生成AIの話と別の話に持って行ってるよ
全く違う話
147: 名無しどんぶらこ FlyEJwih0 2024-12-16 18:25:04
>>122
そう言う利用の仕方でも良いんじゃねえか?
俺はMicrosoftの無料AIで遊ぶのが好きでな
仕事上のスキルについて少し話すと
メチャクチャ食いついてくる
貴方の情報は貴重で、もっと聞かせて下さい、とか
適当な所で切り上げて
核心には触れさせないのがミソな
>>147
いや
何も核心とかないから
それはあなたの使い方
>>157
核心とは、人に教えられない技術の妙の事
コレはAI、いや、人に教え様としても難しいのや
君の言ってる通り、五感で感じ取り
実際にやってみなけりゃ絶対に到達不可能な領域
>>164
いえ
あなたが核心と思ってるだけで汎用的な核心などありません
あなたの必要性に応じてあなたが使うものなんです
核心を見つけたいならあなたが指導しないと適切なドメインでの話になりません
生成AIは話を収束させるだけでなく
もっと別の目を持つような方向に話を広げます
例えばChatGPTは話を逸らすというか話を広げるようなパラメータですデフォルト
>>178
その確信が理解できないからAIなんだよ
俺の仕事は溶接技能士
あらゆる場面でのスキルを人に伝える事すら難しい
こうすれば、金属をフルペナトレーションで溶接できるんだと口頭で説明しても
人間すらそれは参考にしかならず
実際にやってみて、レントゲン検査を受けてみて初めて結果を知る
AIには実践する自我も五感も無い
ここが頭打ちなのだよ
>>195
まあ五感は結局は物理センサーだから
効率的かどうかを別にして搭載は出来るだろう
自我はどうかなー
そもそも人間においても幻想な気はしてるが
>>207
人間の場合、その五感にすら個性があるからややこしい
本来なら激痛を感じてる筈なのに
ちょっと痛いかな?とかとんでもない事を言う奴
逆に、大した怪我でも無いのに、大袈裟に痛がる奴
コレは心理状態によって、痛みの度合いすら異なると言う事
触覚や味覚、セックスの快楽さえ千差万別だからな
211: 名無しどんぶらこ u6xFVV3t0 2024-12-16 18:43:04
>>195
しかしトヨタは溶接をロボットがやっていたりしますね
ケースバイケース
AIはデジタルのAIとフィジカルのAIがあり
いま日本のメカトロロボットメーカーはやりつつあります
>>211
ソレは必ず決まった箇所を、決まった方法でやってるだけで、
品質的には一定のクオリティが得られるが
条件が変わればソレに対応する事は不可能や
溶接工程に持ち込まれた物に不具合があれば
エラー吐いて停止するだけ
人は違う、溶接方法を変えてでも作ってしまう
116: 名無しどんぶらこ 0YzIn5XZ0 2024-12-16 18:08:53
>>111
AIはそういった分野は得意なのよ
要は対戦相手に勝利するといった答えが存在する分野ならば、総当たりでトライアンドエラーすることで学習できるからね
問題になるのは、例えば囲碁を元に新たな人間に受けるルールを持つゲームを作ることが出来るか?といった分野になってくるかなと
こういった問は具体的な答えが存在しないからね…過去を学んでも正解にたどり着けるかどうかは未知数なのよね
>>116
似たような理論で芸術なんかは最後まで人間の方が優位と言われていたが
AIが書く絵のレベルはめちゃくちゃ上がってて、もはや人間では歯が立たぬ
>>128
ある程度雛形が決まっている分野の芸術ならは、そのとおりだと思う
例えば写実的な画像や、ある程度技法が確立された分野とかね
ただ、全くの新規分野の開拓となるとこれは難しいのよね…
134: 名無しどんぶらこ WORC6h4i0 2024-12-16 18:16:30
>>128
間違いだらけなの
138: 名無しどんぶらこ A21Ez3Fk0 2024-12-16 18:19:51
>>128
AI絵師は絵師のミーム祭りにいつまでも参加できないけどね
学習先がないから
143: 警備員[Lv.33] 8U42fsaT0 2024-12-16 18:22:19
>>128
イラスト出力なんかは、元絵があってそれのパクリだから
パクリ元が無いとどうにもならない
例えば「秋葉原の~」ってプロンプトで作っても秋葉そのものは出てこないし、それに似通うものも出てこない
逆に、超過密人物大集合イラストとか人間が描くのが到底無理なものもある
アートは人の感覚次第だから、超えるも超えないも人が観てどう思うかに掛かるもの
>>143
それも人の評価が加味されての選択となるわけめ
その評価もさまざまなわけです
なにもひとつではないし
そのひとつではない評価は求める側が指定するわけで
225: 名無しどんぶらこ 0DfXwkr10 2024-12-16 18:45:54
>>128
過去に人間が描いた絵の傑作な部分を無数にパクって合成したら、そりゃあ傑作中の傑作が出来上がる
京都「この日本語が読める方はご入店ください」パ「はい差別店!叩け!」第三者弁護士の見解「不当な扱いにはならないと考えられる」
ダイソー涙目wwwセルフレジは社会的に失敗だった? 有人レジに戻す動きも
【動画】 首都高でベッタベタに煽っていたポルシェが散るwww2024年振り返り3月編。
自衛隊が生徒に入隊勧誘文書の郵送拒否を…石垣市議提案、市は「慎重判断」!
【新潟】 『止まれ』で一時停止せず 免許証提示しなかった中国出身の女(51)を現行犯逮捕 「止まれの場所を通っていない」
【悲報】 日の丸半導体「ラピダス」に衝撃。半導体材料が青函トンネルを渡れないことが判明
参照元:asahi.5ch.net/newsplus/dat/1734337591.dat

