ついにAI学習のためのデータが枯渇へ、データセット不足のAI企業は大規模で汎用的なLLMから専門性の高いモデルへ移行か #IT | AI囲碁の場合、現存する有名棋譜をほとんど学習した後は、

1牛乳トースト ★ 8ghhqTwZ9 2024-12-16 17:26:31
AIモデルの開発には学習資料となるデータセットが必要不可欠ですが、すでに大規模なモデルはアクセスできるデータのほとんどを食い尽くしており、2028年までにデータを使い果たしてしまう可能性が指摘されています。AIとデータセットの現状について、学術雑誌のNatureがまとめています。

過去10年間でAIは爆発的な成長を遂げており、特に人間の文章を解析してもっともらしい文章を返す能力には目を見張るものがありますが、こうした能力はすべて、インターネット上に存在する既存の文章などさまざまなデータを学習した上で構築されたものです。

インターネット上には膨大な量のデータが存在することは間違いないのですが、研究機関のEpoch AIによると、AIはインターネット上のデータを驚くべきスピードで学習し続けており、そのほとんどを食い尽くしてしまう可能性があるとのことです。

Epoch AIは「2028年頃までに、AIモデルの学習に使用されるデータセットのサイズは、インターネット上に存在する文章の総ストックと同じサイズに達する」と予測。これはつまり、2028年頃までにAIは学習データを使い果たしてしまう可能性が高いということを意味します。データセットが不足することに加え、新聞社などのデータ所有者がコンテンツの利用を取り締まり始め、アクセスをさらに厳しくしているのもAI研究者にとってのハードルとなっています。

こうした問題はAI研究者の間でも認知されており、従来のデータセットを使い果たすことで学習のスケーリングが限界に近づくという法則が語られることがあります。データセットの不足を補うため、AI研究者は学習の方法を変更するなどしてAIの性能向上を模索しています。

*記事全文は以下ソースにて

2024年12月16日 17時00分 GIGAZINE

https://gigazine.net/news/20241216-ai-data-running-out/


【超絶悲報】 子育て世帯、ガチでヤバイ事実が判明してしまう・・・・・

無職ぼく、のどぐろに手を出してしまう

【速報】 奈良県知事「高校生らからは『行きたーい』『めっちゃ楽しみ』『奈良にもっと愛着を感じられる』といったリアルな声も届いている」

【衝撃】 方言と知ってびっくりした言葉wwwwwww

オーストラリア「捕鯨禁止のせいで沿岸にクジラが増えすぎました…クジラを食べるサメも急増、助けて」

三菱UFJ銀行・半沢頭取が会見へ… 元行員が10数億円相当窃取で

【京都】 「この日本語が読める方はご入店ください」飲食店の貼り紙が物議… 使用言語による“差別”は法的に許容される?

【画像】 ムッチムチのえちえち夫婦、見つかるwwwwwwwwww

【悲報】 パチ○コで「右打ち」を注意された無職(82)、刃物突きつけ「外に出ろ」

バイト先で。俺『時給700円で週5日も入ってるのに、5万もない。こりゃ変だぞ』 → 出退勤をメモすると、トンデモナイ事が発覚して…

11名無しどんぶらこ MgIiECK80 2024-12-16 17:31:34
中国に提供してもらえばいいな

17名無しどんぶらこ /sSNBPnj0 2024-12-16 17:32:32
>>11

毛沢東の肖像画をわいせつ物認定した中国の検閲AIワロタ。開発者は粛清されたかも。

22名無しどんぶらこ MgIiECK80 2024-12-16 17:34:58
>>17

アダルトグッズのデザインにしたらアメリカでヒットするかもなw

51名無しどんぶらこ K2TtYEU+0 2024-12-16 17:45:40
>>22

毛沢東抱き枕作ろうぜ

144名無しどんぶらこ MgIiECK80 2024-12-16 18:24:07
>>51

ミイラ状態の毛沢東か

さすがに引くわw

111名無しどんぶらこ doEwXAdu0 2024-12-16 18:05:24
AI囲碁の場合、現存する有名棋譜をほとんど学習した後は、

AIどうしの対局を、人間でいう5000年分おこない、その棋譜をもとに学習して、

結局は人間が想像もできない手の戦術をあみだした

もう人間じゃ勝てない

114名無しどんぶらこ 8ztDJgeS0 2024-12-16 18:07:31
>>111

囲碁みたいな碁盤の目の中で規則的にしか動けないものにはaiは強いけどさあ…

115名無しどんぶらこ FlyEJwih0 2024-12-16 18:08:41
>>111

それは当たり前だな

盤面が決まってる以上、時間を掛ければ全ての手を計算できるからな

創作物はそうはならない

決まった枠がないからな、君はAIを万能だと思い過ぎ

何なら、AI自身に聞いてみな

人の様な新たな創造、発想は無理だとそくこたえる

122名無しどんぶらこ 0YzIn5XZ0 2024-12-16 18:12:08
>>115

そういう意味で言うと、AIって未解読の言語などの解読の検証などには適してるのよね…

まぁ良くも悪くも人で言うなら、頭でっかちで、肉体を介した経験が薄い存在なのよね

145名無しどんぶらこ 0t/nEeTK0 2024-12-16 18:24:28
>>122

肉体を介した経験が薄い?

肉体を介した経験が書いてあるかだけの話なのに

頭でっかちどころか頭小さいのはあなたの方みたいだね

155名無しどんぶらこ 0YzIn5XZ0 2024-12-16 18:27:22
>>145

別にそんな難しい話じゃないよ

単純に情報が足りないって話

あなたが「林檎」という言葉で想起される情報と、AIが想起する情報では圧倒的に情報密度が違うって話よ

わかりやすく例だと、味の評価とかは今のAIには難しい

なぜなら、現状機械的に判断するためのセンサーの感度が、人間の感覚器官とは全く異なる原理で動いてるからね

160名無しどんぶらこ FlyEJwih0 2024-12-16 18:28:22
>>155

少なくとも五感を手に入れないと無理だろうな

166名無しどんぶらこ 0YzIn5XZ0 2024-12-16 18:30:15
>>160

そのためには人間の五感を解析する必要があったりするのよね…

これがまあ、難しいのよね…とにかく人間の感覚って機械工学的観点で見ると、鋭敏なんだか、鈍感なんだか良く分からん領域で動いてるからなぁ…

169名無しどんぶらこ FlyEJwih0 2024-12-16 18:31:27
>>166

個体によっても感じ方が違うしな

人間はやべえよ


たばこ代15,000円→1,000円 / 月

174名無しどんぶらこ 0YzIn5XZ0 2024-12-16 18:33:24
>>169

しかもそんなガバガバ判定のくせに、個体間である程度の共通認識を学習、習得できるからなぁ…

ほんとどうやってるのやら

162名無しどんぶらこ 0t/nEeTK0 2024-12-16 18:29:12
>>155

生成AIの話と別の話に持って行ってるよ

全く違う話

170名無しどんぶらこ 0YzIn5XZ0 2024-12-16 18:31:37
>>162

別におかしな話じゃないよ

生成AIは情報の学習こそがキモであり、その情報量こそがより正確な解を導くための鍵になる

判断するための情報が少なければ、納得のいく解答は導出できないってことやね

147名無しどんぶらこ FlyEJwih0 2024-12-16 18:25:04
>>122

そう言う利用の仕方でも良いんじゃねえか?

俺はMicrosoftの無料AIで遊ぶのが好きでな

仕事上のスキルについて少し話すと

メチャクチャ食いついてくる

貴方の情報は貴重で、もっと聞かせて下さい、とか

適当な所で切り上げて

核心には触れさせないのがミソな

157名無しどんぶらこ 0t/nEeTK0 2024-12-16 18:27:51
>>147

いや

何も核心とかないから

それはあなたの使い方

164名無しどんぶらこ FlyEJwih0 2024-12-16 18:30:07
>>157

核心とは、人に教えられない技術の妙の事

コレはAI、いや、人に教え様としても難しいのや

君の言ってる通り、五感で感じ取り

実際にやってみなけりゃ絶対に到達不可能な領域

178名無しどんぶらこ u6xFVV3t0 2024-12-16 18:34:50
>>164

いえ

あなたが核心と思ってるだけで汎用的な核心などありません

あなたの必要性に応じてあなたが使うものなんです

核心を見つけたいならあなたが指導しないと適切なドメインでの話になりません

生成AIは話を収束させるだけでなく

もっと別の目を持つような方向に話を広げます

例えばChatGPTは話を逸らすというか話を広げるようなパラメータですデフォルト

195名無しどんぶらこ FlyEJwih0 2024-12-16 18:39:08
>>178

その確信が理解できないからAIなんだよ

俺の仕事は溶接技能士

あらゆる場面でのスキルを人に伝える事すら難しい

こうすれば、金属をフルペナトレーションで溶接できるんだと口頭で説明しても

人間すらそれは参考にしかならず

実際にやってみて、レントゲン検査を受けてみて初めて結果を知る

AIには実践する自我も五感も無い

ここが頭打ちなのだよ

207名無しどんぶらこ 192ABeCU0 2024-12-16 18:42:41
>>195

まあ五感は結局は物理センサーだから

効率的かどうかを別にして搭載は出来るだろう

自我はどうかなー

そもそも人間においても幻想な気はしてるが

260名無しどんぶらこ FlyEJwih0 2024-12-16 18:55:25
>>207

人間の場合、その五感にすら個性があるからややこしい

本来なら激痛を感じてる筈なのに

ちょっと痛いかな?とかとんでもない事を言う奴

逆に、大した怪我でも無いのに、大袈裟に痛がる奴

コレは心理状態によって、痛みの度合いすら異なると言う事

触覚や味覚、セックスの快楽さえ千差万別だからな

211名無しどんぶらこ u6xFVV3t0 2024-12-16 18:43:04
>>195

しかしトヨタは溶接をロボットがやっていたりしますね

ケースバイケース

AIはデジタルのAIとフィジカルのAIがあり

いま日本のメカトロロボットメーカーはやりつつあります

229名無しどんぶらこ FlyEJwih0 2024-12-16 18:46:43
>>211

ソレは必ず決まった箇所を、決まった方法でやってるだけで、

品質的には一定のクオリティが得られるが

条件が変わればソレに対応する事は不可能や

溶接工程に持ち込まれた物に不具合があれば

エラー吐いて停止するだけ

人は違う、溶接方法を変えてでも作ってしまう

236名無しどんぶらこ u6xFVV3t0 2024-12-16 18:48:19
>>229

だから

そういうふうになるんですよ

人間がやるように

239名無しどんぶらこ FlyEJwih0 2024-12-16 18:49:38
>>236

どうやって?

五感や自我を手に入れて

自問自答できる様になると?

ソレは人間様の方が許さんぞ

特に自我はな

244名無しどんぶらこ u6xFVV3t0 2024-12-16 18:50:57
>>239

私に聞くよりネット調べた方が確実ですよ

246名無しどんぶらこ FlyEJwih0 2024-12-16 18:51:44
>>244

話にならんな

AIコピペの限界

250名無しどんぶらこ u6xFVV3t0 2024-12-16 18:52:39
>>246

ここで話って話にならない

116名無しどんぶらこ 0YzIn5XZ0 2024-12-16 18:08:53
>>111

AIはそういった分野は得意なのよ

要は対戦相手に勝利するといった答えが存在する分野ならば、総当たりでトライアンドエラーすることで学習できるからね

問題になるのは、例えば囲碁を元に新たな人間に受けるルールを持つゲームを作ることが出来るか?といった分野になってくるかなと

こういった問は具体的な答えが存在しないからね…過去を学んでも正解にたどり着けるかどうかは未知数なのよね

128名無しどんぶらこ +xXUHO630 2024-12-16 18:13:50
>>116

似たような理論で芸術なんかは最後まで人間の方が優位と言われていたが

AIが書く絵のレベルはめちゃくちゃ上がってて、もはや人間では歯が立たぬ

132名無しどんぶらこ 0YzIn5XZ0 2024-12-16 18:16:19
>>128

ある程度雛形が決まっている分野の芸術ならは、そのとおりだと思う

例えば写実的な画像や、ある程度技法が確立された分野とかね

ただ、全くの新規分野の開拓となるとこれは難しいのよね…

134名無しどんぶらこ WORC6h4i0 2024-12-16 18:16:30
>>128

間違いだらけなの

138名無しどんぶらこ A21Ez3Fk0 2024-12-16 18:19:51
>>128

AI絵師は絵師のミーム祭りにいつまでも参加できないけどね

学習先がないから

143 警備員[Lv.33] 8U42fsaT0 2024-12-16 18:22:19
>>128

イラスト出力なんかは、元絵があってそれのパクリだから

パクリ元が無いとどうにもならない

例えば「秋葉原の~」ってプロンプトで作っても秋葉そのものは出てこないし、それに似通うものも出てこない

逆に、超過密人物大集合イラストとか人間が描くのが到底無理なものもある

アートは人の感覚次第だから、超えるも超えないも人が観てどう思うかに掛かるもの

151名無しどんぶらこ 0t/nEeTK0 2024-12-16 18:26:45
>>143

それも人の評価が加味されての選択となるわけめ

その評価もさまざまなわけです

なにもひとつではないし

そのひとつではない評価は求める側が指定するわけで

225名無しどんぶらこ 0DfXwkr10 2024-12-16 18:45:54
>>128

過去に人間が描いた絵の傑作な部分を無数にパクって合成したら、そりゃあ傑作中の傑作が出来上がる

見るたびに笑ってしまう画像貼って

【画像】 嫌われてる都道府県、やばい!

京都「この日本語が読める方はご入店ください」パ「はい差別店!叩け!」第三者弁護士の見解「不当な扱いにはならないと考えられる」

ダイソー涙目wwwセルフレジは社会的に失敗だった? 有人レジに戻す動きも

【動画】 首都高でベッタベタに煽っていたポルシェが散るwww2024年振り返り3月編。

【画像】 内田真礼ちゃんのドデカいおケツωωωωωωωωω

自衛隊が生徒に入隊勧誘文書の郵送拒否を…石垣市議提案、市は「慎重判断」!

【新潟】 『止まれ』で一時停止せず 免許証提示しなかった中国出身の女(51)を現行犯逮捕 「止まれの場所を通っていない」

【悲報】 日の丸半導体「ラピダス」に衝撃。半導体材料が青函トンネルを渡れないことが判明


参照元:asahi.5ch.net/newsplus/dat/1734337591.dat

ダイエット福袋
ダイエット福袋 3980円

アダルト福袋
アダルト福袋 ~ホットな夜を演出~ 2980円


たばこ代15,000円→1,000円 / 月

コメントを投稿