Falcon Arabic - המודל הראשון בערבית בסדרת Falcon ו-Falcon-H1
המוסד לחדשנות טכנולוגית (TII) של איחוד האמירויות, זרוע המחקר של מועצת הטכנולוגיה המתקדמת של אבו דאבי (ATRC), חשף היום שני פיתוחים שקשורים בבינה מלאכותית: Falcon Arabic, המודל הראשון מסוגו בסדרת פלקון בשפה הערבית - הנחשב נכון לעתה למודל ה-AI בעל הביצועים הטובים באזור בשפה הערבית - וכן Falcon-H1, מודל שהושק זה עתה המגדיר מחדש את הביצועים והניידות באמצעות תיכנון חדש של הארכיטקטורה. בקטגוריית מודלי ה-AI בסדר גודל קטן עד בינוני (30 עד 70 מיליארד פרמטרים), ביצועי Falcon-H1 עולים על מנועים ברי השוואה של Meta LlaMA ו-Alibaba Qwen, והוא מאפשר להטמיע בינה מלאכותית בהתקנים הנמצאים בשימוש יומיומי ובסביבה המוגבלת במשאבים. ההכרזה ניתנה במהלך נאום המדיניות של פייסל אל באנאי, יועץ לנשיא איחוד האמירויות ומזכ"ל ATRC, באירוע Make it in the Emirates.
Falcon Arabic מבוסס על Falcon 3-7B (7 מיליארד פרמטרים) והוא אחד ממודלי ה-AI המתקדמים ביותר בשפה הערבית נכון לעתה. המודל, אשר עבר אימון באמצעות ערכת נתונים איכותית וטבעית (לא מתורגמת) בערבית הכוללת שפה מודרנית וסטנדרטית כמו גם ניבים אזוריים, מכיל את המגוון השפתי המלא של העולם הערבי. על פי מדדי Open Arabic LLM Leaderboard, ביצועי Falcon Arabic עולים על כל המודלים האזוריים האחרים שזמינים בשפה הערבית, מה שמחזק את מעמדו המוביל בתחום הבינה המלאכותית הריבונית והרב שפתית. הוא מדורג כמודל בעל הביצועים הטובים ביותר מסוגו בשפה הערבית, עם ביצועים התואמים לאלה של מודלים הגדולים עד פי 10 ממנו, ותוך הוכחה שארכיטקטורה חכמה מסוגלת להתעלות בביצועיה על ארכיטקטורה גדולה בלבד.
במקביל לכך, מודל Falcon-H1 אשר הושק זה לא מזמן מתוכנן להרחיב משמעותית את הגישה ל-AI בעלת ביצועים חזקים, זאת על ידי צמצום כוח המחשוב והמומחיות הטכנית שהיו דרושים בעבר כדי להפעיל מערכות מתקדמות. ההכרזה מתבססת על הצלחתה של TII עם סדרת Falcon 3, אשר דורגה כאחד ממודלי ה-AI הגלובליים הטובים ביותר שמסוגל לפעול ביחידת עיבוד גרפי (GPU) אחת, זו פריצת דרך משמעותית שמאפשרת למפתחים, לחברות סטארטאפ ולמוסדות שאין ברשותם תשתית חזקה להטמיע בינה מלאכותית מתקדמת בדרך משתלמת.
"אנו גאים על כך שסוף סוף יש באפשרותנו להוסיף את השפה הערבית ל-Falcon, וגאים עוד יותר בכך שמודל השפה הגדול בעל הביצועים הטובים ביותר בעולם הערבי נבנה באיחוד האמירויות", אמר פייסל אל באנאי. "היום, מה שדרוש כדי להוביל את זירת הבינה המלאכותית אינו רק קנה מידה גדול. לשם כך יש צורך בכלים חזקים, שימושיים ואוניברסליים. Falcon-H1 משקף את מחובותינו לאספקת בינה מלאכותית שתתאים לכולם - ולא רק למעטים".
Falcon-H1 ממשיך לתמוך בשפות אירופאיות ובפעם הראשונה יש לו את היכולת המדרגית לתמוך בלמעלה מ-100 שפות, זאת הודות ל-tokenizer רב לשוני אשר אומן עם ערכות נתונים מגוונות.
"התייחסנו ל-Falcon-H1 לא רק כנקודת ציון מחקרית אלא גם כאתגר הנדסי: כיצד לספק יעילות יוצאת דופן וחסרת פשטות", אמרה ד"ר נאג'ווה אגאג', מנכל"ית TII. "מודל זה משקף את המחויבות שלנו להקמת מערכות קשיחות מבחינה טכנית אשר משרתות את העולם האמיתי. Falcon אינו רק מודל: מדובר בתשתית המעצימה חוקרים, מפתחים וממציאים, במיוחד בסביבות בהן המשאבים מוגבלים אך השאיפות גדולות".
"סדרת Falcon-H1 ממחישה כיצד ארכיטקטורות חדשות מסוגלות לתת דרור להזדמנויות חדשות באימון AI תוך הדגמה של הפוטנציאל הטמון במודלים קומפקטיים במיוחד", אמר ד"ר חכים חאסיד, חוקר ראשי במרכז TII לחקר מדעי הדיגיטל וה-AI. "יכולת זו מרחיבה משמעותית את האפשרויות בקנה המידה הקטן, ומאפשרת ליישם בינה מלאכותית חזקה בהתקני קצה בהם ישנה חשיבות קריטית לפרטיות, ליעילות ולזמן אחזור קצר. התמקדנו בהפחתת המורכבות מבלי להתפשר על יכולת".
כל מודל במשפחת Falcon-H1 מתעלה על מודלים אחרים וכפולים בגודלם, והוא קובע רף חדש ליחסי ביצועים ליעילות. בנוסף, המודלים מצטיינים בחישובים מתמטיים, בהסקת מסקנות, בכתיבת קוד, בהבנת הקשר נרחב ובמשימות רב שפתיות.
המודלים של Falcon כבר מפעילים יישומים בעולם האמיתי. Falcon תמך, תוך שותפות עם קרן ביל ומלינדה גייטס, בפיתוח של AgriLLM, פתרון שעוזר לחוואים לקבל החלטות חכמות יותר בתנאי אקלים מאתגרים. האקוסיסטמה Falcon של TII הורדה יותר מ-55 מיליון פעמים ברחבי העולם והיא נחשבת למשפחת מודלי ה-AI הפתוחים החזקה והעקבית ביותר אשר צמחה מאזור המזרח התיכון.
מודלי AI רבים מתמקדים במקרי שימוש צרכניים וצרים, אך TII נתנה עדיפות ליצירת מודלים יסודיים אותם ניתן להתאים לעמידה בדרישות הענף, המחקר והציבור הרחב מבלי להתפשר על נגישות. המודלים הללו תוכננו להטמעה במגוון תרחישים מציאותיים, לשמירה על נגישות, לצריכת משאבים יעילה ולהתאמה לסביבות שונות.
כל מודלי Falcon הם מודלי קוד פתוח והם זמינים ב-Hugging Face וב-FalconLLM.TII.ae ברישיון TII Falcon, רישיון מבוסס Apache 2.0, המקדם פיתוח אחראי ואתי של בינה מלאכותית.