SOWing Information: 画像生成におけるMLLMを用いた文脈的整合性の育成
拡散モデルにおける情報拡散の無秩序な性質を改善し、文脈的に一貫した画像生成を実現する新しい手法が提…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
拡散モデルにおける情報拡散の無秩序な性質を改善し、文脈的に一貫した画像生成を実現する新しい手法が提…
PixelGenが知覚的教師あり学習を導入し、ピクセル拡散モデルの画像生成品質を大幅に向上させました。
拡散トランスフォーマーの画像生成において、動的チャンキングにより計算効率と画像品質を向上させました。
画像生成AI「ChatGPT Images 2.0」が描写能力と日本語文字列出力の品質を大幅に向上させました。
Stable Diffusionが特定のCLIP埋め込みに過度に依存し、それが記憶(memorization)の原因となっているこ…
拡散トランスフォーマー(DiT)のLoRAファインチューニングにおけるスタイル混在問題を解決する新手法が発…
拡散トランスフォーマーの学習を加速させる新しいアライメントフレームワーク「AHPA」が提案されました。
ChatGPTの画像生成AI「ChatGPT Images 2.0」の進化について、開発者が語りました。
SenseTimeがVAE不要で高品質な画像生成AI「SenseNova U1」をオープンモデルとして公開しました。
renueが2D図面からノイズを除去し、純粋な形状を自動抽出する新機能を発表しました。
OpenAIが、指示内容を深く解釈する「Thinkingモード」を搭載した最新画像生成モデル「Images 2.0」を発表…
ChatGPT Images 2.0などの画像生成AIで『ウォーリーをさがせ!』風の画像を生成する試みが行われました。