アリババのQwen-Image-2.0、圧縮率を倍増させ生成ステップを40から4に削減
アリババが画像モデルQwen-Image-2.0を発表し、画像圧縮率を倍増させ、生成ステップを大幅に削減しました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
アリババが画像モデルQwen-Image-2.0を発表し、画像圧縮率を倍増させ、生成ステップを大幅に削減しました。
Lumaが画像生成モデル「Uni-1.1」のAPIを公開し、OpenAIやGoogleと競合する価格と品質を提供します。
DDIMがDDPMよりも幻覚(ハルシネーション)を起こしやすい原因を理論的に解明しました。
Qwen3-VL-Segは、言語指示に基づいて画像内の特定の領域をピクセルレベルで高精度にセグメンテーションす…
人物画像アニメーションにおいて、高精度な手の動きを生成する新手法「IPA」が発表されました。
画像生成モデルの品質評価において、従来の指標の課題を解決する新しい評価フレームワーク「APEX」が発表…
テキストから画像を生成するモデルにおいて、複雑な意図を忠実に再現する新フレームワーク「SCOPE」が提案…
Flow-OPDが、テキストから画像生成モデルのマルチタスクアライメントにおける課題を解決しました。
教師ありスパースオートエンコーダ(SAE)が、Stable Diffusion 3.5で画像の再構成と編集に成功しました。
拡散モデルにおける反実仮想生成の精度を向上させる新しいガイダンス手法が提案されました。
マルチモーダル合成画像の評価において、物理法則に基づいた新しいベンチマーク指標「PCMDE」が提案されま…
拡散モデルの画像生成において、強化学習を用いてタイムステップの最適化手法「ART-RL」が開発されました。