Spark and Hadoop

 Spark & Hadoop are one of the best tools in market today for ingesting and analyzing Big Data

 Big data characteristics can

–  Volume – large amount of data

–  Velocity – near real time data flow

–  Variety – mix of structured, semi-structured and unstructured data

– Veracity – low quality data

We will present concepts used to ingest and process data on a Hadoop cluster using Spark with the most up-to-date tools and techniques.

 What are the challenges faced by Spark developers while designing and building data lake applications

 How to identify which tool is the right one to use in a given situation

ניתוח נתונים מתקדם ב-Tableau

טאבלו נחשב כיום לאחד הכלים המובילים בעולם לניתוח נתונים (Data Analysis) ו-ויזואליזצית נתונים (Data Visualization) ונמצא בשימוש נרחב בשוק העבודה הישראלי.

נוחות השימוש בו היא חסרת תחרות ומשתמשים יכולים לייצר דו"חות עסקיים מורכבים גם ללא רקע מתמטי / סטטיסטי משמעותי. בהרצאה יראו המשתתפים כיצד לייצר דו"חות משמעותיים ודשבורדים אינטראקטיביים מקבצי טקסט ואקסל פשוטים שכולנו עובדים איתם כל יום. נלמד כיצד לטעון נתונים למערכת, כיצד לנקות ולהכין אותם כך שיתאימו לצרכינו, כיצד לייצר חישובים, להציג את הנתונים בצורות שונות ורבות וכיצד לחלץ תובנות מהמידע שלנו כדי לענות על שאלות עסקיות אמיתיות.

POWER BI

כלי הפרונט Power BI מבית היוצר של מייקרוסופט.

כלי תצוגת נתונים ואנליזה המאפשר לקבל החלטות מושכלות במהירות וביעילות. הכלי מאפשר לבנות דאשבורדים ולחקור נתונים בעזרת דו"חות ויזואליים שניתן לשתף, לפרסם ולעבוד עליהם. הכלי יחסית קל ללימוד ברמה הבסיסית. נדון באתגרים בפיתוח כאשר נתקלים בשפות הקוד DAX וML שהכלי עובד איתם.

Python

Python is an easy-to-use interpreted language that has steadily gained in popularity over the last few years in a wide spectrum of applications, ranging from AI to Web Services. Python is also powerful, portable, object-oriented open source programming language for writing standalone programs, quick scripts, and prototypes for large applications. We will briefly present these concepts and describe the most common Python application domains and tools

Machine learning

Machine learning is becoming huge business in the days of big data and huge web sites. This Lecturewill introduce the participants to data science and machine learning in particular reviewing and training using the most popular algorithms.

Docker 

This Lecture introduces Docker to application developers. It teaches the reasons why we need container technology to begin with and the specifics of the Docker platform.