💠 Compositional Learning Journal Club
Join us this week for an in-depth discussion on Compositional Learning in the context of cutting-edge text-to-image generative models. We will explore recent breakthroughs and challenges, focusing on how these models handle compositional tasks and where improvements can be made.
🌟 This Week's Presentation:
📌 Title:
A Cat Is A Cat (Not A Dog!): Unraveling Information Mix-ups in Text-to-Image Encoders through Causal Analysis and Embedding Optimization
🎙️ Presenter: Amir Kasaei
🧠 Abstract:
This work presents an in-depth analysis of the causal structure in the text encoder of text-to-image (T2I) diffusion models, highlighting its role in introducing information bias and loss. While prior research has mainly addressed these issues during the denoising stage, this study focuses on the underexplored contribution of text embeddings—particularly in multi-object generation scenarios. The authors investigate how text embeddings influence the final image output and why models often favor the first-mentioned object, leading to imbalanced representations. To mitigate this, they propose a training-free text embedding balance optimization method that improves information balance in Stable Diffusion by 125.42%. Additionally, a new automatic evaluation metric is introduced, offering a more accurate assessment of information loss with an 81% concordance rate with human evaluations. This metric better captures object presence and accuracy compared to existing measures like CLIP-based text-image similarity scores.
📄 Paper:
A Cat Is A Cat (Not A Dog!): Unraveling Information Mix-ups in Text-to-Image Encoders through Causal Analysis and Embedding Optimization
Session Details:
- 📅 Date: Tuesday
- 🕒 Time: 4:45 - 5:45 PM
- 🌐 Location: Online at vc.sharif.edu/ch/rohban
@Ai_Events
Join us this week for an in-depth discussion on Compositional Learning in the context of cutting-edge text-to-image generative models. We will explore recent breakthroughs and challenges, focusing on how these models handle compositional tasks and where improvements can be made.
🌟 This Week's Presentation:
📌 Title:
A Cat Is A Cat (Not A Dog!): Unraveling Information Mix-ups in Text-to-Image Encoders through Causal Analysis and Embedding Optimization
🎙️ Presenter: Amir Kasaei
🧠 Abstract:
This work presents an in-depth analysis of the causal structure in the text encoder of text-to-image (T2I) diffusion models, highlighting its role in introducing information bias and loss. While prior research has mainly addressed these issues during the denoising stage, this study focuses on the underexplored contribution of text embeddings—particularly in multi-object generation scenarios. The authors investigate how text embeddings influence the final image output and why models often favor the first-mentioned object, leading to imbalanced representations. To mitigate this, they propose a training-free text embedding balance optimization method that improves information balance in Stable Diffusion by 125.42%. Additionally, a new automatic evaluation metric is introduced, offering a more accurate assessment of information loss with an 81% concordance rate with human evaluations. This metric better captures object presence and accuracy compared to existing measures like CLIP-based text-image similarity scores.
📄 Paper:
A Cat Is A Cat (Not A Dog!): Unraveling Information Mix-ups in Text-to-Image Encoders through Causal Analysis and Embedding Optimization
Session Details:
- 📅 Date: Tuesday
- 🕒 Time: 4:45 - 5:45 PM
- 🌐 Location: Online at vc.sharif.edu/ch/rohban
@Ai_Events
arXiv.org
A Cat Is A Cat (Not A Dog!): Unraveling Information Mix-ups in...
This paper analyzes the impact of causal manner in the text encoder of text-to-image (T2I) diffusion models, which can lead to information bias and loss. Previous works have focused on addressing...
Research Position at the Center for Information Systems and Data Science,
In Collaboration with ex-Google DeepMind, J.P.Morgan and Google.
Position Requirements:
1. We are seeking highly motivated students with exceptional implementation skills, capable of writing clean code in PyTorch.
2. A strong mathematical is definitely a prerequisite for students, as the problem statements are relatively complex and theoretical. Applicants should be capable of reading and understanding research papers that contain substantial mathematical content..
Project Descriptions:
1. Bandit & RL Projects (in collaboration with Iranian ex-Google DeepMind researcher):
This project focuses on addressing problems related to Non-Stationary Bandits and Non-Stationary Stochastic Bandits algorithms. This paper was written by the supervisor of this research.
Additionally, certain reinforcement learning (RL) problems, whose initial results have already been obtained in specific cases, will be continued for generalization in the general case .Detailed topics will be introduced by the supervising professors after candidate selection.
2. Finance Project (in collaboration with Iranian lead of the Quant team at J.P.Morgan ):
We invite applicants interested in deep learning applications for portfolio optimization and stochastic modeling. The project combines reinforcement learning methods with continuous financial modeling, aiming to develop intelligent investment strategies leveraging latent and stochastic market factors Similar to the Princeton University paper and this paper.
3.Learning Theory Project(in collaboration with Iranian Senior Research Scientist at Google):
the main supervisor of this research formulated a well-posed and transparent problem in the mathematical analysis of learning, similar to their previous work, namely this paper.
To submit your CV, please contact via email with the subject line "ISDS AI positions" :
[email protected]
@Ai_Events
In Collaboration with ex-Google DeepMind, J.P.Morgan and Google.
Position Requirements:
1. We are seeking highly motivated students with exceptional implementation skills, capable of writing clean code in PyTorch.
2. A strong mathematical is definitely a prerequisite for students, as the problem statements are relatively complex and theoretical. Applicants should be capable of reading and understanding research papers that contain substantial mathematical content..
Project Descriptions:
1. Bandit & RL Projects (in collaboration with Iranian ex-Google DeepMind researcher):
This project focuses on addressing problems related to Non-Stationary Bandits and Non-Stationary Stochastic Bandits algorithms. This paper was written by the supervisor of this research.
Additionally, certain reinforcement learning (RL) problems, whose initial results have already been obtained in specific cases, will be continued for generalization in the general case .Detailed topics will be introduced by the supervising professors after candidate selection.
2. Finance Project (in collaboration with Iranian lead of the Quant team at J.P.Morgan ):
We invite applicants interested in deep learning applications for portfolio optimization and stochastic modeling. The project combines reinforcement learning methods with continuous financial modeling, aiming to develop intelligent investment strategies leveraging latent and stochastic market factors Similar to the Princeton University paper and this paper.
3.Learning Theory Project(in collaboration with Iranian Senior Research Scientist at Google):
the main supervisor of this research formulated a well-posed and transparent problem in the mathematical analysis of learning, similar to their previous work, namely this paper.
To submit your CV, please contact via email with the subject line "ISDS AI positions" :
[email protected]
@Ai_Events
This media is not supported in your browser
VIEW IN TELEGRAM
به امید روزهای خوب✌❤
نظریهی نامحبوب:
ریویو کردن کدی که کاملا با ابزار نوشته شده انرژی بیشتری نیاز داره تا نوشتن کد از صفر!
موافق 👍
مخالف 👎
@Ai_Events
موافق 👍
مخالف 👎
@Ai_Events
حرکت جدید OpenAI: رقابت با مایکروسافت و گوگل در حوزه ابزارهای کاری هوش مصنوعی
شرکت OpenAI در حال ساخت یک پلتفرم یکپارچه کاری است
برخلاف تصور عمومی که OpenAI را فقط به عنوان خالق ChatGPT میشناسد، این شرکت به صورت پنهانی در حال توسعه یک بستهی کامل ابزارهای هوشمند کاریه که مستقیماً با Google Workspace و Microsoft Office رقابت خواهد کرد.
قابلیتهای پیشرفته این بسته:
- به اشتراک گذاری مستندات با قابلیت ویرایش همزمان
- چت تیمی یکپارچه با هوش مصنوعی
- یادداشتبرداری هوشمند در لحظه
- همنویسی کد (Collaborative Coding)
- ابزارهای صوتی و پردازش گفتار
نکته جالب اینجاست که مایکروسافت، بزرگترین شریک و سرمایهگذار OpenAI، خود یکی از اصلیترین رقبای این پلتفرم جدید خواهد بود! این حرکت میتواند به یک رقابت استراتژیک بین دو غول فناوری منجر شود.
آینده ChatGPT: "اپ همهکاره" برای محیط کار
اگر این پروژه با موفقیت راهاندازی شود، ChatGPT از یک چتبات ساده به دستیار هوشمند همهجانبه کاری تبدیل خواهد شد که میتواند:
- ایمیلهای شما را بنویسد
- یادداشتهای جلسات را سازماندهی کند
- در کدنویسی همکاری کند
- و حتی جایگزین بسیاری از اپلیکیشنهای فعلی شود!
به نظر میرسد OpenAI تاریخ جدیدی را در تقویم فناوری رقم زده است. آیا شاهد ظهور "ابراپلیکیشن هوش مصنوعی" برای محیط کار خواهیم بود؟
@Ai_Events
شرکت OpenAI در حال ساخت یک پلتفرم یکپارچه کاری است
برخلاف تصور عمومی که OpenAI را فقط به عنوان خالق ChatGPT میشناسد، این شرکت به صورت پنهانی در حال توسعه یک بستهی کامل ابزارهای هوشمند کاریه که مستقیماً با Google Workspace و Microsoft Office رقابت خواهد کرد.
قابلیتهای پیشرفته این بسته:
- به اشتراک گذاری مستندات با قابلیت ویرایش همزمان
- چت تیمی یکپارچه با هوش مصنوعی
- یادداشتبرداری هوشمند در لحظه
- همنویسی کد (Collaborative Coding)
- ابزارهای صوتی و پردازش گفتار
نکته جالب اینجاست که مایکروسافت، بزرگترین شریک و سرمایهگذار OpenAI، خود یکی از اصلیترین رقبای این پلتفرم جدید خواهد بود! این حرکت میتواند به یک رقابت استراتژیک بین دو غول فناوری منجر شود.
آینده ChatGPT: "اپ همهکاره" برای محیط کار
اگر این پروژه با موفقیت راهاندازی شود، ChatGPT از یک چتبات ساده به دستیار هوشمند همهجانبه کاری تبدیل خواهد شد که میتواند:
- ایمیلهای شما را بنویسد
- یادداشتهای جلسات را سازماندهی کند
- در کدنویسی همکاری کند
- و حتی جایگزین بسیاری از اپلیکیشنهای فعلی شود!
به نظر میرسد OpenAI تاریخ جدیدی را در تقویم فناوری رقم زده است. آیا شاهد ظهور "ابراپلیکیشن هوش مصنوعی" برای محیط کار خواهیم بود؟
@Ai_Events
✍ دکتر مهدی شامیزنجانی
🖋️هوش مصنوعی و امنیت ملی کشورها
هوش مصنوعی به عنوان یک فناوری تحولآفرین در عصر دیجیتال، نقشی اساسی در قدرت و امنیت ملی کشورها ایفا میکند. در دهههای گذشته، فناوریهای دیجیتالی مانند اینترنت و ماهواره بر معادلات امنیتی اثرگذار بودهاند؛ اما ورود هوش مصنوعی، سرعت و مقیاس این تأثیرگذاری را بیسابقه کرده است. امروزه بسیاری از دولتها هوش مصنوعی را «فناوری راهبردی» قلمداد میکنند که میتواند موازنه قدرت را دگرگون کند.
حال این پرسش مطرح است که آیا در عصر دیجیتال یک کشور میتواند بدون برتری در حوزه هوش مصنوعی امنیت ملی خود را به خوبی تأمین کند؟ شواهد و دیدگاههای جهانی نشان میدهد که پاسخ، منفی است.
در این نوشتار ابتدا به اهمیت برخورداری از توانمندیهای مطلوب در حوزه هوش مصنوعی برای تأمین امنیت ملی پرداخته میشود. سپس کاربردهای کلان هوش مصنوعی در ارتقای امنیت ملی را در سه عرصه امنیت «سایبری»، «نظامی» و «اطلاعاتی» مرور میکنیم. در ادامه اقدامات و برنامههای مهم آمریکا و چین در بهرهگیری از هوش مصنوعی برای اهداف امنیتی تشریح شده و نمونههایی از پروژهها و ابتکارات آنان معرفی میگردد. در پایان نیز توصیههایی راهبردی در جهت تقویت امنیت ملی در پرتوی هوش مصنوعی مطرح خواهد شد.
🌐 لینک مطلب
@Ai_Events
🖋️هوش مصنوعی و امنیت ملی کشورها
هوش مصنوعی به عنوان یک فناوری تحولآفرین در عصر دیجیتال، نقشی اساسی در قدرت و امنیت ملی کشورها ایفا میکند. در دهههای گذشته، فناوریهای دیجیتالی مانند اینترنت و ماهواره بر معادلات امنیتی اثرگذار بودهاند؛ اما ورود هوش مصنوعی، سرعت و مقیاس این تأثیرگذاری را بیسابقه کرده است. امروزه بسیاری از دولتها هوش مصنوعی را «فناوری راهبردی» قلمداد میکنند که میتواند موازنه قدرت را دگرگون کند.
حال این پرسش مطرح است که آیا در عصر دیجیتال یک کشور میتواند بدون برتری در حوزه هوش مصنوعی امنیت ملی خود را به خوبی تأمین کند؟ شواهد و دیدگاههای جهانی نشان میدهد که پاسخ، منفی است.
در این نوشتار ابتدا به اهمیت برخورداری از توانمندیهای مطلوب در حوزه هوش مصنوعی برای تأمین امنیت ملی پرداخته میشود. سپس کاربردهای کلان هوش مصنوعی در ارتقای امنیت ملی را در سه عرصه امنیت «سایبری»، «نظامی» و «اطلاعاتی» مرور میکنیم. در ادامه اقدامات و برنامههای مهم آمریکا و چین در بهرهگیری از هوش مصنوعی برای اهداف امنیتی تشریح شده و نمونههایی از پروژهها و ابتکارات آنان معرفی میگردد. در پایان نیز توصیههایی راهبردی در جهت تقویت امنیت ملی در پرتوی هوش مصنوعی مطرح خواهد شد.
🌐 لینک مطلب
@Ai_Events