Hadoop Logo

מבוא ל-Big Data, ל-Hadoop ול-NoSQL

בשבועות האחרונים אני משתתף בהעברת קורס Master DBA בג’ון ברייס. הקורס, למי שלא מכיר, בא להכשיר אנשים לתפקידי DBA.
הקורס בנוי מצד אחד מקורסים על בסיסי נתונים – כמו לימוד שפת SQL, תכנות ב-PL/SQL וניהול של בסיסי הנתונים ומצד שני השלמה של נושאים אחרים כמו Linux.
בחצי השני של הקורס התלמידים לומדים על Big Data, על Python (כשפת תכנות) ועל NoSQL. בסוף הקורס הם מבצעים פרויקט גדול שמשלב את מה שהם למדו.

אתמול העברתי נושא בתחום של Big Data, מבוא ל-Hadoop ו-מבוא בסיסי ל-NoSQL (כי יש להם עוד 8 שעורים בנושא).
המשך קריאה…

מדריך להורדה בחינם Enterprise NoSQL for Dummies

הפעם פוסט קצר – מדריך Enterprise NoSQL for Dummies מאת Charlie Brooks להורדה.

המשך קריאה…

איך אורקל מצליחים לקרוא 2.5 מיליארד רשומות בשנייה

הפוסט הזה פורסם לראשונה ב-ilDBA: איך אורקל מצליחים לקרוא 2.5 מיליארד רשומות בשנייה. אני מעתיק אותו גם לכאן לצורך התיעוד. אם הגעתם עד כאן, תנו קפיצה קלה ל-ilDBA ופרגנו לנו גם שם… 🙂

עריכה: הפוסט הזה גם פורסם בגיקטיים: איך אורקל מצליחים לקרוא 2.5 מיליארד רשומות בשנייה


במסיבת עיתונאים שנערכה שלשום בערב (10 ביוני 2014) בסן פרנסיסקו, הכריז לארי אליסון על התכונה החדשה ביותר שמתווספת לאורקל 12c – ה-In Memory Option. ההכרזה אומנם הייתה שלשום אבל השחרור הרשמי של הפיצ’ר לקהל החדש יהיה רק בעוד חודש.
הטכנולוגיה החדשה היא אחת המסקרנות ביותר – זוהי הטכנולוגיה שאמורה להפוך את גרסת אורקל 12c שיצאה כבר לפני שנה למובילה הטכנולוגית המובהקת בתחום בסיסי הנתונים.
המשך קריאה…

סמינר שבוע אורקל: Deep Dive into Oracle NoSQL – המצגת

במסגרת שבוע אורקל העברתי אתמול סמינר על Oracle NoSQL זו השנה השנייה.  הסמינר נקרא Deep Dive into Oracle NoSQL Technologies and Solutions והוא מסביר על עולם ה-Big Data באופן כללי, מסביר מה זה NoSQL ומתמקד בפתרון מבית אורקל – Oracle NoSQL (אבולציה של מוצר שאורקל קנו כבר לפני 8 שנים בערך – SleepyCat). במסגרת הסמינר אנחנו יורדים ממש לפרטים – מהסבר כללי על איך זה עובד ועד הבנה של ה-Java API של המוצר כדי להבין תכונות שלו.

Oracle_NoSQLDatabase_Logo_650

להלן הסילבוס של הסמינר:

המשך קריאה…

מדען Big Data? הנה ההזדמנות שלך להתעשר…

לאחרונה אני כותב המון על Big Data – הנושא מרתק אותי ואני באמת מאמין שהעולם הזה רק ילך ויתפתח עם הזמן. אם אתם זוכרים, אז כתבתי בעבר שחלק גדול מעולם ה-Big Data לא סובב סביב DBA-ים וניהול המידע אלא יותר סביב אלגוריתמים ופתרונות פיתוחיים לבעיות מורכבות. אחד התפקידים החדשים בעולם הזה הוא “מדען נתונים” – זה מעין תפקיד שנמצא בין DBA, מנתח מערכות, data miner ומפתח קוד שתפקידו לקחת את כמויות המידע האדירות ולראות איך אפשר לנצל אותם בארגון או בכלל.

מסתבר שאני לא לבד בדעה הזו ובשבוע שעבר שמתי לב שגם EMC חושבים כמוני והם מפרסמים המון דברים חדשים על ביג דאטה. הדבר האחרון ששמתי אליו לב והוא תחרות מעניינת שהם יצרו סביב ישום פתרונות לבעיות אמיתיות באמצעות אלגוריתמים ל-Big Data המיועדת למדעני מידע.

המשך קריאה…

מיפוי עולם ה-Big Data

הבעיה העיקרית עם באזוורד חדש כמו Big Data היא שמאוד קשה למפות מי החברות שנמצאות במרחב ובמה כל אחת מתעסקת. הדבר הופך להיות מורכב עוד יותר בעולם כמו Big Data בו לכל אחד יש מה להגיד והפתרונות הם רבים ומגוונים.

נתקלתי היום במשהו מעניין שפורסם ב-Forbes. תמונה המתארת את מיפוי עולם ה-Big Data שנעשה על ידי Dave Feinleib. מה שדייב ניסה לעשות זה למפות את החברות המסחריות והטכנולוגיות הקשורות לתוך מפה ברורה של עולם ה-Big Data. לפי דעתי הוא עשה עבודה יפה מאוד – אבל כדאי לשים לב שהוא לא הפריד בין פתרונות חומרה, פתרונות תשתית (ובכלל, כלי טעינה כמו ODI, DataStage ו-Informatica) ופתרונות אפליקטיביים (Front End). בנוסף, כדאי לשים לב שזו לא רשימה מלאה – חברה כמו Netezza (IBM) לדוגמה, לא מופיעה שם.

המשך קריאה…