SlideShare une entreprise Scribd logo
1  sur  37
Télécharger pour lire hors ligne
Think BIG
                                     Büyük Düşün!...
                                          10 Nisan 2012 – İstanbul
                                          11 Nisan 2012 – Ankara

Cüneyt Göksu, VBT
IBM Gold Consultant
IBM Champion for Data Management
Cuneyt.Goksu@vbt.com.tr

    @CuneytG

     http://www.linkedin.com/in/cuneytgoksu
Ajanda

1) Neden BIG Data? Buralara Nasıl Geldik?
2) BIG Data Bileşenleri nedir?
3) Mevcut Sistemler ile entegrasyonu nasıl olacak ?
4) BIG Data Uygulamaları var mı?
Instrumented, Interconnected, Intelligent World
                                            4.6
30 billion RFID                         billion
  tags today                           camera
(1.3B in 2005)                         phones
                                         world     %80 vs % 20
                                         wide
                                       100s of
                                       millions      Yapısal
                                       of GPS
                                      enabled
                                                        ve
                                       devices       Yapısal
                                           sold      Olmayan
                                      annually
                                              2+
                                         billion
                                        people
           76 million smart             on the
           meters in 2009…             Web by
            200M by 2014                    end
                                          2011
Sosyal Ağlar ve Sosyal İş Yaşamı


    •   Ağustos 2012’de 1 Milyar kullanıcıya ulaşması
        bekleniyor. 12TB/gün «log data» üretiliyor.


    •   2012 sonunda 400+ Milyon kullanıcıya ulaşması
        bekleniyor.

    •   130 Milyon kullanıcı var.



    •   100 million aktif kullanıcı. 12+ TB of tweet
        data/gün!..
Sosyal Ağlar ve Sosyal İş Yaşamı




       Google günde 24
       Petabytes veri işliyor



                      4.6 Milyar     cep
                      telefonu var



                                 2 Milyar Internet kullanıcısının
                                 2013’deki yıllık trafiği 667
                                 Exabytes
Kullanıcılar sadece insanlar değil!..




           Source: http://www.mediabistro.com/alltwitter/how-to-get-fido-to-tweet-infographic_b17521
Sensor güdümlü ve enstrüman temelli iş dünyası.
BÜYÜK miktarda veriyi, MAKİNA HIZINDA üretiyor.




      Her motor 10TB/30 Dk veri üretiyor.
“Data generated by machines and sensors will
exceed that generated by social media by at
least a factor of 10.” *
Leon Katsnelson
Program Director, Big Data & Cloud Computing
IBM



* Makina ve duyargalar, sosyal medyadan 10 kat daha fazla veri üretiyorlar.
35 ZB
      1.8 ZB
                   (1 ZB = 1B TB)
       1 ZB
      1 ZB=1B TB



                       4Trillion
                         8GB
Gbyte : 109             iPods
Tbyte : 1012
Pbyte : 1015
Ebyte : 1018
Zbyte : 1021
Bütün bu bilgiyi saklayacak yer yok!
 Ağustos 2010'da Adam Savage,
  arabasının fotoğrafını akıllı
  telefon ile çekip, üzerine de "işe
  gidiyorum" yazarak, Twitter
  adresine yükledi.

 Fotoğraf akıllı telefon ile
  çekildiğinden, çekildiği yerin
  coğrafi bilgisi otomatik olarak
  metadata içinde yer alıyordu.


 Böylece Bay Savage, evinin,
  arabasının yerini herkese
  belirtmiş oldu, üstelik evde
  yokken!
Bir sosyal medya insanı kaç para
             eder?
BIG Data Bileşenleri : 3V
Mevcut sistemlerin veri işleme ve analiz kapasitelerinin çok üstünde
kapasitelere ihtiyaç duyan, büyük miktarda, çeşitlilikte ve hızda türeyen
verilerin işlenerek değerlendirilmesi ve değer yaratılması


Variety       Farklı yapılarda, çeşitlilikte ve
(Çeşit)       karmaşıklıktaki verilerin
              yönetilmesi. Yapısal, log, ham ve
              yapısal olmayan gibi...

Velocity      Büyük miktarda sürekli akışkan
(Hız)         veri.

Volume        TB'tan PetaByte'a (1K TBs),
(Hacim)       Exabyte'a (1M TB), Zetabytes'a
              (1B TBs) giden ölçekler
BIG Data Bileşenleri + 2V
Verification   Veri güvenli olarak transfer edilmeli, doğru
(Doğrulama)    kullanıcılar tarafından erişilebilmeli.

Value          Son kullanıcı ve kurum için bir değer
(Değer)        yaratabilmeli
Geleneksel BT: 30 Yıllık Transaction Yönetimi.


                                     BT uzun yıllar "iş
                                      transaction"larının ürettiği
                                      verileri toplayıp buradan anlam
                        Analytics     çıkardı.
          Data


                                     Veriler büyük oranda, kurum
                                      içinde üretildi.

                                     Yapılan analizler, «geleceği
                                      tahmin etmek» yerine,
                                      genellikle operasyonların
                                      iyileştirilmesine yönelikti.
Operational
 Systems         CRM   Censors
Geçmişin performanslı sistemleri, geleceğin tahmin
   edilmesi için yeterli olmayabilir!




Sürekli geçmişi iyileştirmek ve onu gözlemek yerine nasıl ileriye odaklanacağız?
Houston... We have a problem!...
 Bir kurumun çözümleyebileceği verinin yüzdesi, o kuruma
  gelen verinin artış hızı ile orantılı olarak azalıyor.

 Başka bir deyişle, zaman geçtikçe, işimiz hakkında daha az
  bilgi sahibi oluyoruz.


                             Data AVAILABLE to
                              an organization




                                             Data an organization
                                                can PROCESS
IDUG (International DB2 Users Group) 2007 Konferansı - Keynote



 Enterprise Intelligence
 ”Data finds the data … Relevance finds the user”

   Jeff Jonas, Chief Scientist, IBM Entity Analytics
   IBM Distinguished Engineer
   JeffJonas@us.ibm.com
Big Data Analitik Uygulamaları
Smarter Healthcare     Multi-channel        Finance         Log Analysis
                           sales




Homeland Security      Traffic Control      Telecom         Search Quality




  Manufacturing      Trading Analytics   Fraud and Risk   Retail: Churn, NBO
Bazı Big Data uygulamaları


   Log Analytics (IT for IT)
   Smart Grid / Smarter Utilities
   RFID Tracking & Analytics
   Fraud / Risk Management & Modeling
   360° View of the Customer
   Warehouse Extension
   Email / Call Center Transcript Analysis
   Call Detail Record Analysis
   IBM Watson
Gittikçe daha da fazla artan veri üretimi.
•   Retailers collect click-stream data from Web site interactions and loyalty
    card-drive transaction data
     – This traditional POS information is used by retailer for shopping basket
       analysis, inventory replenishment
     – But data is being provided to suppliers for customer buying analysis

•   Healthcare has traditionally been dominated by paper-based systems, but
    this information is getting digitized

•   Science is increasingly dominated by big science initiatives
     – Large-scale experiments generate over 15 PB of data a year and can’t be
       stored within the data center; then sent to laboratories

•   Financial services are seeing larger volumes through smaller trading
    sizes, increased market volatility, and technological improvements in
    automated and algorithmic trading
Hareket halindeki veri
Verinin hiç saklanmadığını, dolayısı ile saklama maaliyetlerinin hiç
                     olmadığını hayal edin!
Data In Motion
                  Bir önceki çözüm, yeni talep edilen 3G ihtiyaçlarına ve
                   artan iş ve veri hacmine cevap vermekten uzaktı.

                     Streams ve Netezza ortaklığındaki çözüm ile

                 -   Yeni ürünlerin hazırlanıp, piyasaya sunulma süresi
                     saatlerden dakikalara indi.
                 -   Verinin birleştirme ve yükleme zamanı %90 azaldı.
Veri = Ürün
•   Tamamen ücretsiz oyun olanakları sunuyor.
•   Sanal ürünler satarak gelir elde ediyor.
•   Aylık ortalama 232M aktif kullanıcı bulunuyor.
•   Oyuncuların %95’i hiç alışveriş yapmıyor!
•   Big Data analizi kullanarak oyun dünyasını altüst etti.


     Biz aslında bir oyun şirketiymiş gibi gözüken bir veri
     analizi şirketiyiz
                          Ken Rudin, Zynga VP of Analytics
Supply Chain Recommendation for Natural Disasters
Correlate combined risk and
impending weather threats to    Dynamically
   optimize inventory and       updated risk
   determine supply chain       assessment
      recommendations           for assets in
                               projected path


                                    Real-time
                                  projections of
                                  hurricane path
The IBM Big Data Platform
IBM Big Data Platformu
       Nisan 5 duyurusu: IBM Big Data & Netezza Product Group


                                                                  InfoSphere BigInsights
                                                                Hadoop temelli, az gecikmeli,
                                                                çeşitli ve yüksek hacimli veri
                                                                            analizi

                                                                        Hadoop


                                   Information                                                   Stream Computing
InfoSphere Information Server       Integration                                                                             InfoSphere Streams
Yüksek hacimli veri entegrasyon                                                                                          Akışkan Veri için az gecikmeli
         ve dönüşüm                                                                                                                 analiz




                                                         MPP Data Warehouse

        IBM InfoSphere
          Warehouse                                                                              IBM Smart Analytics
   Yüksek hacimli, yapısal veri                                                                                               IBM Informix Timeseries
                                                                                                       System
            analizi                                                                                                            Time-structured analytics
                                                                                                 Yapısal veri üzerinde
                                     IBM Netezza High                    IBM Netezza 1000
                                                                             BI+Ad Hoc            operasyonel analiz
                                     Capacity Appliance
                                   Sorgulanabilir Arşivlenmiş             Yapısal Veri Analizi
                                          yapısal veri
Big Data Platformu ne yapar?
               Farklı Çeşitlilikte Veri Analizi
               Karışık özellikte veriler üzerinde daha önce
               yapılamayan analizlerin yapılması.



               Hareketli Bilgi Analizi
               Yüksek hacimli akan verinin, ad-hoc analizi




               Çok Yüksek Hacimli Veri Analizi
               PB ölçeğinde verinin uygun fiat/performans kriterlerinde,
               analizi



               Keşfet ve Deneyle
               Veri üzerinde Ad-hoc analiz, veri keşfi ve
               deneyleme

               Yönet ve Planla
               Veri kurallarını, bütünlüğünü denetleme ve
               uygulama
Tamamlayıcı Analitik
        Geleneksel Yaklaşım                           Yeni Yaklaşım
      Yapısal, Analitik, Mantıksal       Yaratıcı, bütünlükçü düşünce, sezgisel



                     Veri Ambarı                    Hadoop
                                                    Streams
  Transaction Data                                                    Web Kütükleri

Iç Uygulamalar
                      Yapısal                                                Sosyal Veri
               Structured                          Yapısal Değil
                                                         Unstructured
              Repeatable              Kurumsal           Exploratory
                 Tekrar edilebilir
Mainframe Verisi   Linear            Entegrasyon   Keşfedilebilir Text Veri: eposta
                                                         Iterative
        Monthly sales reports                              Brand sentiment
                          Lineer
         Profitability analysis
  OLTP Sistemleri surveys                            Döngüsel
                                                           Product strategy
           Customer                                        Maximum asset utilization imaj
                                                                    Duyarga Verisi:


     ERP              Geleneksel                      Yeni                 RFID
                      Kaynaklar                     Kaynaklar
Açık Kaynak Yazılımla iç içe!
•    Açık Kaynak Topluluğa yıllardır yapılan katkılar
-   Apache Hadoop ve Jaql, Apache Derby, Apache
    Geronimo, Apache Jakarta
-   Eclipse: IBM tarafından kuruldu.
-   Lucene katıları, IBM Lucene Extension Library
    (ILEL) kanalı ile...
-   DRDA, XQuery, SQL, XML4J, XERCES, HTTP,
    Java, Linux...

•   Açık kaynak kodlu IBM Yazılımları
     – WebSphere: Apache
     – Rational: Eclipse ve Apache
     – InfoSphere: Eclipse ve Apache

•   IBM’s BigInsights (Hadoop) is %100 açık kaynak
    kodlu bir yazılımdır
February 2012 “The Forrester Wave™: Enterprise Hadoop Solutions, Q1 2012”
    Forrester Wave™: Enterprise Hadoop Solutions, Q1 ’2012

                                                                            Amazon


                                                                             IBM


                                                                             Oracle
BIG Data teknolojilerini öğrenmenin eğlenceli ve
                   kolay yolu:
 Satıcı bağımsız, topluluk
  temelli, IBM ve diğer liderler
  tarafından destekleniyor;
 Esnek, çevrim içi eğitimler;
 Ücretsiz kurslar ve çalışma
  materyalleri;
 Video destekli, kolay öğrenim
  olanakları;
 Bulut temelli alıştırma
  imkanları;
 14000+ kayıtlı öğrenci.
Cüneyt Göksu, VBT
IBM Gold Consultant
IBM Champion for Data Management
37
Cuneyt.Goksu@vbt.com.tr

Contenu connexe

Similaire à BIG DATA Nedir ve IBM Çözümleri.

No.4 5 global-trends_tr
No.4 5 global-trends_trNo.4 5 global-trends_tr
No.4 5 global-trends_trKREA Digital
 
12. map info kullanıcı konferansı altdata
12. map info kullanıcı konferansı  altdata12. map info kullanıcı konferansı  altdata
12. map info kullanıcı konferansı altdataAltan Atabarut, MSc.
 
Webrazzi Dijital'14 - Adaptive Marketing in Action - Yelda Erciro, GroupM
Webrazzi Dijital'14 - Adaptive Marketing in Action - Yelda Erciro, GroupMWebrazzi Dijital'14 - Adaptive Marketing in Action - Yelda Erciro, GroupM
Webrazzi Dijital'14 - Adaptive Marketing in Action - Yelda Erciro, GroupMWebrazzi
 
Dijitalin Yükselişi ile Değişen Ticaret ve Pazarlama Trendleri
Dijitalin Yükselişi ile Değişen Ticaret ve Pazarlama TrendleriDijitalin Yükselişi ile Değişen Ticaret ve Pazarlama Trendleri
Dijitalin Yükselişi ile Değişen Ticaret ve Pazarlama TrendleriCihan Salim
 
İş Zekasının Değişen Kuralları
İş Zekasının Değişen Kurallarıİş Zekasının Değişen Kuralları
İş Zekasının Değişen Kurallarıugur candan
 
Gartner Tr2009 Istanbul May27 Qvbi Tech Summary
Gartner Tr2009 Istanbul May27 Qvbi Tech SummaryGartner Tr2009 Istanbul May27 Qvbi Tech Summary
Gartner Tr2009 Istanbul May27 Qvbi Tech SummaryMUZAFFER YONTEM
 
Veri Kullanımı ve Programatik Reklamcılık- IAB
Veri Kullanımı ve Programatik Reklamcılık- IABVeri Kullanımı ve Programatik Reklamcılık- IAB
Veri Kullanımı ve Programatik Reklamcılık- IABMutlu Dogus Yildirim
 
Teknoloji ile Etkin Pazarlama - Cenk Bayrakdar
Teknoloji ile Etkin Pazarlama - Cenk BayrakdarTeknoloji ile Etkin Pazarlama - Cenk Bayrakdar
Teknoloji ile Etkin Pazarlama - Cenk Bayrakdarvirutic
 
SAP Forum 2009: BI - BI Mobile
SAP Forum 2009: BI - BI MobileSAP Forum 2009: BI - BI Mobile
SAP Forum 2009: BI - BI MobileFIT Consulting
 
Cortexgrafikdatamining
CortexgrafikdataminingCortexgrafikdatamining
CortexgrafikdataminingFatma ÇINAR
 
Atif Unaldi - Commerce (Bilisim)
Atif Unaldi - Commerce (Bilisim)Atif Unaldi - Commerce (Bilisim)
Atif Unaldi - Commerce (Bilisim)Atıf ÜNALDI
 
Veri Görselleştirme ve Grafik Datamining
Veri Görselleştirme ve Grafik DataminingVeri Görselleştirme ve Grafik Datamining
Veri Görselleştirme ve Grafik DataminingFatma ÇINAR
 
Novida-Dijital Güç (Bilen Toplum)
Novida-Dijital Güç (Bilen Toplum)Novida-Dijital Güç (Bilen Toplum)
Novida-Dijital Güç (Bilen Toplum)Novida Global
 
Gartner EEE - Bilgi Yönetimi 2012 - Çalık Holding Sunumu
Gartner EEE - Bilgi Yönetimi 2012 - Çalık Holding SunumuGartner EEE - Bilgi Yönetimi 2012 - Çalık Holding Sunumu
Gartner EEE - Bilgi Yönetimi 2012 - Çalık Holding Sunumuhalilaksu
 
BT Günlüğü Dergisi Ocak 2022 Sayısı
BT Günlüğü Dergisi Ocak 2022 SayısıBT Günlüğü Dergisi Ocak 2022 Sayısı
BT Günlüğü Dergisi Ocak 2022 SayısıEylül Medya
 

Similaire à BIG DATA Nedir ve IBM Çözümleri. (20)

Microsoft SQL 2014
Microsoft SQL 2014Microsoft SQL 2014
Microsoft SQL 2014
 
No.4 5 global-trends_tr
No.4 5 global-trends_trNo.4 5 global-trends_tr
No.4 5 global-trends_tr
 
12. map info kullanıcı konferansı altdata
12. map info kullanıcı konferansı  altdata12. map info kullanıcı konferansı  altdata
12. map info kullanıcı konferansı altdata
 
Webrazzi Dijital'14 - Adaptive Marketing in Action - Yelda Erciro, GroupM
Webrazzi Dijital'14 - Adaptive Marketing in Action - Yelda Erciro, GroupMWebrazzi Dijital'14 - Adaptive Marketing in Action - Yelda Erciro, GroupM
Webrazzi Dijital'14 - Adaptive Marketing in Action - Yelda Erciro, GroupM
 
Dijitalin Yükselişi ile Değişen Ticaret ve Pazarlama Trendleri
Dijitalin Yükselişi ile Değişen Ticaret ve Pazarlama TrendleriDijitalin Yükselişi ile Değişen Ticaret ve Pazarlama Trendleri
Dijitalin Yükselişi ile Değişen Ticaret ve Pazarlama Trendleri
 
İş Zekasının Değişen Kuralları
İş Zekasının Değişen Kurallarıİş Zekasının Değişen Kuralları
İş Zekasının Değişen Kuralları
 
Gartner Tr2009 Istanbul May27 Qvbi Tech Summary
Gartner Tr2009 Istanbul May27 Qvbi Tech SummaryGartner Tr2009 Istanbul May27 Qvbi Tech Summary
Gartner Tr2009 Istanbul May27 Qvbi Tech Summary
 
Dijital trendler
Dijital trendlerDijital trendler
Dijital trendler
 
Veri Kullanımı ve Programatik Reklamcılık- IAB
Veri Kullanımı ve Programatik Reklamcılık- IABVeri Kullanımı ve Programatik Reklamcılık- IAB
Veri Kullanımı ve Programatik Reklamcılık- IAB
 
Büyük Veri(Big Data)
Büyük Veri(Big Data)Büyük Veri(Big Data)
Büyük Veri(Big Data)
 
Teknoloji ile Etkin Pazarlama - Cenk Bayrakdar
Teknoloji ile Etkin Pazarlama - Cenk BayrakdarTeknoloji ile Etkin Pazarlama - Cenk Bayrakdar
Teknoloji ile Etkin Pazarlama - Cenk Bayrakdar
 
SAP Forum 2009: BI - BI Mobile
SAP Forum 2009: BI - BI MobileSAP Forum 2009: BI - BI Mobile
SAP Forum 2009: BI - BI Mobile
 
Cortexgrafikdatamining
CortexgrafikdataminingCortexgrafikdatamining
Cortexgrafikdatamining
 
Atif Unaldi - Commerce (Bilisim)
Atif Unaldi - Commerce (Bilisim)Atif Unaldi - Commerce (Bilisim)
Atif Unaldi - Commerce (Bilisim)
 
Veri Görselleştirme ve Grafik Datamining
Veri Görselleştirme ve Grafik DataminingVeri Görselleştirme ve Grafik Datamining
Veri Görselleştirme ve Grafik Datamining
 
Visual analysis
Visual analysisVisual analysis
Visual analysis
 
Novida-Dijital Güç (Bilen Toplum)
Novida-Dijital Güç (Bilen Toplum)Novida-Dijital Güç (Bilen Toplum)
Novida-Dijital Güç (Bilen Toplum)
 
Gartner EEE - Bilgi Yönetimi 2012 - Çalık Holding Sunumu
Gartner EEE - Bilgi Yönetimi 2012 - Çalık Holding SunumuGartner EEE - Bilgi Yönetimi 2012 - Çalık Holding Sunumu
Gartner EEE - Bilgi Yönetimi 2012 - Çalık Holding Sunumu
 
BT Günlüğü Dergisi Ocak 2022 Sayısı
BT Günlüğü Dergisi Ocak 2022 SayısıBT Günlüğü Dergisi Ocak 2022 Sayısı
BT Günlüğü Dergisi Ocak 2022 Sayısı
 
Microsoft bi day_v2.0
Microsoft bi day_v2.0Microsoft bi day_v2.0
Microsoft bi day_v2.0
 

Plus de Cuneyt Goksu

Makine Düsünebilir mi
Makine Düsünebilir miMakine Düsünebilir mi
Makine Düsünebilir miCuneyt Goksu
 
Db2 for z os trends
Db2 for z os trendsDb2 for z os trends
Db2 for z os trendsCuneyt Goksu
 
Db2 analytics accelerator technical update
Db2 analytics accelerator  technical updateDb2 analytics accelerator  technical update
Db2 analytics accelerator technical updateCuneyt Goksu
 
Perfect trio : temporal tables, transparent archiving in db2 for z_os and idaa
Perfect trio : temporal tables, transparent archiving in db2 for z_os and idaaPerfect trio : temporal tables, transparent archiving in db2 for z_os and idaa
Perfect trio : temporal tables, transparent archiving in db2 for z_os and idaaCuneyt Goksu
 
How should I monitor my idaa
How should I monitor my idaaHow should I monitor my idaa
How should I monitor my idaaCuneyt Goksu
 
Ibm machine learning for z os
Ibm machine learning for z osIbm machine learning for z os
Ibm machine learning for z osCuneyt Goksu
 
Machine Learning for z/OS
Machine Learning for z/OSMachine Learning for z/OS
Machine Learning for z/OSCuneyt Goksu
 
Temporal Tables, Transparent Archiving in DB2 for z/OS and IDAA
Temporal Tables, Transparent Archiving in DB2 for z/OS and IDAATemporal Tables, Transparent Archiving in DB2 for z/OS and IDAA
Temporal Tables, Transparent Archiving in DB2 for z/OS and IDAACuneyt Goksu
 
IDUG NA 2014 / 11 tips for DB2 11 for z/OS
IDUG NA 2014 / 11 tips for DB2 11 for z/OSIDUG NA 2014 / 11 tips for DB2 11 for z/OS
IDUG NA 2014 / 11 tips for DB2 11 for z/OSCuneyt Goksu
 
Seçsi̇s sistemi hakkında değerlendirme ve öneriler
Seçsi̇s sistemi hakkında değerlendirme ve önerilerSeçsi̇s sistemi hakkında değerlendirme ve öneriler
Seçsi̇s sistemi hakkında değerlendirme ve önerilerCuneyt Goksu
 
Gaining Insight into
Gaining Insight intoGaining Insight into
Gaining Insight intoCuneyt Goksu
 
Identify SQL Tuning Opportunities
Identify SQL Tuning OpportunitiesIdentify SQL Tuning Opportunities
Identify SQL Tuning OpportunitiesCuneyt Goksu
 
Diagnose RIDPool Failures
Diagnose RIDPool FailuresDiagnose RIDPool Failures
Diagnose RIDPool FailuresCuneyt Goksu
 
Sosyal Medya ve Yeni Örgütlenmeler
Sosyal Medya ve Yeni ÖrgütlenmelerSosyal Medya ve Yeni Örgütlenmeler
Sosyal Medya ve Yeni ÖrgütlenmelerCuneyt Goksu
 
Understanding IBM Tivoli OMEGAMON for DB2 Batch Reporting, Customization and ...
Understanding IBM Tivoli OMEGAMON for DB2 Batch Reporting, Customization and ...Understanding IBM Tivoli OMEGAMON for DB2 Batch Reporting, Customization and ...
Understanding IBM Tivoli OMEGAMON for DB2 Batch Reporting, Customization and ...Cuneyt Goksu
 
Denver 2012 -- After IDUG Conference
Denver 2012 -- After IDUG ConferenceDenver 2012 -- After IDUG Conference
Denver 2012 -- After IDUG ConferenceCuneyt Goksu
 
Occupy wall street
Occupy wall streetOccupy wall street
Occupy wall streetCuneyt Goksu
 

Plus de Cuneyt Goksu (20)

Home Office
Home OfficeHome Office
Home Office
 
Makine Düsünebilir mi
Makine Düsünebilir miMakine Düsünebilir mi
Makine Düsünebilir mi
 
WhatsApp nedir
WhatsApp nedirWhatsApp nedir
WhatsApp nedir
 
Db2 for z os trends
Db2 for z os trendsDb2 for z os trends
Db2 for z os trends
 
Db2 analytics accelerator technical update
Db2 analytics accelerator  technical updateDb2 analytics accelerator  technical update
Db2 analytics accelerator technical update
 
Perfect trio : temporal tables, transparent archiving in db2 for z_os and idaa
Perfect trio : temporal tables, transparent archiving in db2 for z_os and idaaPerfect trio : temporal tables, transparent archiving in db2 for z_os and idaa
Perfect trio : temporal tables, transparent archiving in db2 for z_os and idaa
 
How should I monitor my idaa
How should I monitor my idaaHow should I monitor my idaa
How should I monitor my idaa
 
Ibm machine learning for z os
Ibm machine learning for z osIbm machine learning for z os
Ibm machine learning for z os
 
Machine Learning for z/OS
Machine Learning for z/OSMachine Learning for z/OS
Machine Learning for z/OS
 
Temporal Tables, Transparent Archiving in DB2 for z/OS and IDAA
Temporal Tables, Transparent Archiving in DB2 for z/OS and IDAATemporal Tables, Transparent Archiving in DB2 for z/OS and IDAA
Temporal Tables, Transparent Archiving in DB2 for z/OS and IDAA
 
IDUG NA 2014 / 11 tips for DB2 11 for z/OS
IDUG NA 2014 / 11 tips for DB2 11 for z/OSIDUG NA 2014 / 11 tips for DB2 11 for z/OS
IDUG NA 2014 / 11 tips for DB2 11 for z/OS
 
Seçsi̇s sistemi hakkında değerlendirme ve öneriler
Seçsi̇s sistemi hakkında değerlendirme ve önerilerSeçsi̇s sistemi hakkında değerlendirme ve öneriler
Seçsi̇s sistemi hakkında değerlendirme ve öneriler
 
Gaining Insight into
Gaining Insight intoGaining Insight into
Gaining Insight into
 
Identify SQL Tuning Opportunities
Identify SQL Tuning OpportunitiesIdentify SQL Tuning Opportunities
Identify SQL Tuning Opportunities
 
Diagnose RIDPool Failures
Diagnose RIDPool FailuresDiagnose RIDPool Failures
Diagnose RIDPool Failures
 
Sosyal Medya ve Yeni Örgütlenmeler
Sosyal Medya ve Yeni ÖrgütlenmelerSosyal Medya ve Yeni Örgütlenmeler
Sosyal Medya ve Yeni Örgütlenmeler
 
Understanding IBM Tivoli OMEGAMON for DB2 Batch Reporting, Customization and ...
Understanding IBM Tivoli OMEGAMON for DB2 Batch Reporting, Customization and ...Understanding IBM Tivoli OMEGAMON for DB2 Batch Reporting, Customization and ...
Understanding IBM Tivoli OMEGAMON for DB2 Batch Reporting, Customization and ...
 
Denver 2012 -- After IDUG Conference
Denver 2012 -- After IDUG ConferenceDenver 2012 -- After IDUG Conference
Denver 2012 -- After IDUG Conference
 
Nato ve medya
Nato ve medyaNato ve medya
Nato ve medya
 
Occupy wall street
Occupy wall streetOccupy wall street
Occupy wall street
 

BIG DATA Nedir ve IBM Çözümleri.

  • 1. Think BIG Büyük Düşün!... 10 Nisan 2012 – İstanbul 11 Nisan 2012 – Ankara Cüneyt Göksu, VBT IBM Gold Consultant IBM Champion for Data Management Cuneyt.Goksu@vbt.com.tr @CuneytG http://www.linkedin.com/in/cuneytgoksu
  • 2. Ajanda 1) Neden BIG Data? Buralara Nasıl Geldik? 2) BIG Data Bileşenleri nedir? 3) Mevcut Sistemler ile entegrasyonu nasıl olacak ? 4) BIG Data Uygulamaları var mı?
  • 3. Instrumented, Interconnected, Intelligent World 4.6 30 billion RFID billion tags today camera (1.3B in 2005) phones world %80 vs % 20 wide 100s of millions Yapısal of GPS enabled ve devices Yapısal sold Olmayan annually 2+ billion people 76 million smart on the meters in 2009… Web by 200M by 2014 end 2011
  • 4. Sosyal Ağlar ve Sosyal İş Yaşamı • Ağustos 2012’de 1 Milyar kullanıcıya ulaşması bekleniyor. 12TB/gün «log data» üretiliyor. • 2012 sonunda 400+ Milyon kullanıcıya ulaşması bekleniyor. • 130 Milyon kullanıcı var. • 100 million aktif kullanıcı. 12+ TB of tweet data/gün!..
  • 5. Sosyal Ağlar ve Sosyal İş Yaşamı Google günde 24 Petabytes veri işliyor 4.6 Milyar cep telefonu var 2 Milyar Internet kullanıcısının 2013’deki yıllık trafiği 667 Exabytes
  • 6. Kullanıcılar sadece insanlar değil!.. Source: http://www.mediabistro.com/alltwitter/how-to-get-fido-to-tweet-infographic_b17521
  • 7. Sensor güdümlü ve enstrüman temelli iş dünyası. BÜYÜK miktarda veriyi, MAKİNA HIZINDA üretiyor. Her motor 10TB/30 Dk veri üretiyor.
  • 8. “Data generated by machines and sensors will exceed that generated by social media by at least a factor of 10.” * Leon Katsnelson Program Director, Big Data & Cloud Computing IBM * Makina ve duyargalar, sosyal medyadan 10 kat daha fazla veri üretiyorlar.
  • 9. 35 ZB 1.8 ZB (1 ZB = 1B TB) 1 ZB 1 ZB=1B TB 4Trillion 8GB Gbyte : 109 iPods Tbyte : 1012 Pbyte : 1015 Ebyte : 1018 Zbyte : 1021
  • 10. Bütün bu bilgiyi saklayacak yer yok!
  • 11.  Ağustos 2010'da Adam Savage, arabasının fotoğrafını akıllı telefon ile çekip, üzerine de "işe gidiyorum" yazarak, Twitter adresine yükledi.  Fotoğraf akıllı telefon ile çekildiğinden, çekildiği yerin coğrafi bilgisi otomatik olarak metadata içinde yer alıyordu.  Böylece Bay Savage, evinin, arabasının yerini herkese belirtmiş oldu, üstelik evde yokken!
  • 12. Bir sosyal medya insanı kaç para eder?
  • 13. BIG Data Bileşenleri : 3V Mevcut sistemlerin veri işleme ve analiz kapasitelerinin çok üstünde kapasitelere ihtiyaç duyan, büyük miktarda, çeşitlilikte ve hızda türeyen verilerin işlenerek değerlendirilmesi ve değer yaratılması Variety Farklı yapılarda, çeşitlilikte ve (Çeşit) karmaşıklıktaki verilerin yönetilmesi. Yapısal, log, ham ve yapısal olmayan gibi... Velocity Büyük miktarda sürekli akışkan (Hız) veri. Volume TB'tan PetaByte'a (1K TBs), (Hacim) Exabyte'a (1M TB), Zetabytes'a (1B TBs) giden ölçekler
  • 14. BIG Data Bileşenleri + 2V Verification Veri güvenli olarak transfer edilmeli, doğru (Doğrulama) kullanıcılar tarafından erişilebilmeli. Value Son kullanıcı ve kurum için bir değer (Değer) yaratabilmeli
  • 15. Geleneksel BT: 30 Yıllık Transaction Yönetimi.  BT uzun yıllar "iş transaction"larının ürettiği verileri toplayıp buradan anlam Analytics çıkardı. Data  Veriler büyük oranda, kurum içinde üretildi.  Yapılan analizler, «geleceği tahmin etmek» yerine, genellikle operasyonların iyileştirilmesine yönelikti. Operational Systems CRM Censors
  • 16. Geçmişin performanslı sistemleri, geleceğin tahmin edilmesi için yeterli olmayabilir! Sürekli geçmişi iyileştirmek ve onu gözlemek yerine nasıl ileriye odaklanacağız?
  • 17. Houston... We have a problem!...  Bir kurumun çözümleyebileceği verinin yüzdesi, o kuruma gelen verinin artış hızı ile orantılı olarak azalıyor.  Başka bir deyişle, zaman geçtikçe, işimiz hakkında daha az bilgi sahibi oluyoruz. Data AVAILABLE to an organization Data an organization can PROCESS
  • 18.
  • 19.
  • 20. IDUG (International DB2 Users Group) 2007 Konferansı - Keynote Enterprise Intelligence ”Data finds the data … Relevance finds the user” Jeff Jonas, Chief Scientist, IBM Entity Analytics IBM Distinguished Engineer JeffJonas@us.ibm.com
  • 21. Big Data Analitik Uygulamaları Smarter Healthcare Multi-channel Finance Log Analysis sales Homeland Security Traffic Control Telecom Search Quality Manufacturing Trading Analytics Fraud and Risk Retail: Churn, NBO
  • 22. Bazı Big Data uygulamaları  Log Analytics (IT for IT)  Smart Grid / Smarter Utilities  RFID Tracking & Analytics  Fraud / Risk Management & Modeling  360° View of the Customer  Warehouse Extension  Email / Call Center Transcript Analysis  Call Detail Record Analysis  IBM Watson
  • 23. Gittikçe daha da fazla artan veri üretimi. • Retailers collect click-stream data from Web site interactions and loyalty card-drive transaction data – This traditional POS information is used by retailer for shopping basket analysis, inventory replenishment – But data is being provided to suppliers for customer buying analysis • Healthcare has traditionally been dominated by paper-based systems, but this information is getting digitized • Science is increasingly dominated by big science initiatives – Large-scale experiments generate over 15 PB of data a year and can’t be stored within the data center; then sent to laboratories • Financial services are seeing larger volumes through smaller trading sizes, increased market volatility, and technological improvements in automated and algorithmic trading
  • 24. Hareket halindeki veri Verinin hiç saklanmadığını, dolayısı ile saklama maaliyetlerinin hiç olmadığını hayal edin!
  • 25. Data In Motion  Bir önceki çözüm, yeni talep edilen 3G ihtiyaçlarına ve artan iş ve veri hacmine cevap vermekten uzaktı. Streams ve Netezza ortaklığındaki çözüm ile - Yeni ürünlerin hazırlanıp, piyasaya sunulma süresi saatlerden dakikalara indi. - Verinin birleştirme ve yükleme zamanı %90 azaldı.
  • 27. Tamamen ücretsiz oyun olanakları sunuyor. • Sanal ürünler satarak gelir elde ediyor. • Aylık ortalama 232M aktif kullanıcı bulunuyor. • Oyuncuların %95’i hiç alışveriş yapmıyor! • Big Data analizi kullanarak oyun dünyasını altüst etti. Biz aslında bir oyun şirketiymiş gibi gözüken bir veri analizi şirketiyiz Ken Rudin, Zynga VP of Analytics
  • 28. Supply Chain Recommendation for Natural Disasters
  • 29. Correlate combined risk and impending weather threats to Dynamically optimize inventory and updated risk determine supply chain assessment recommendations for assets in projected path Real-time projections of hurricane path
  • 30. The IBM Big Data Platform
  • 31. IBM Big Data Platformu Nisan 5 duyurusu: IBM Big Data & Netezza Product Group InfoSphere BigInsights Hadoop temelli, az gecikmeli, çeşitli ve yüksek hacimli veri analizi Hadoop Information Stream Computing InfoSphere Information Server Integration InfoSphere Streams Yüksek hacimli veri entegrasyon Akışkan Veri için az gecikmeli ve dönüşüm analiz MPP Data Warehouse IBM InfoSphere Warehouse IBM Smart Analytics Yüksek hacimli, yapısal veri IBM Informix Timeseries System analizi Time-structured analytics Yapısal veri üzerinde IBM Netezza High IBM Netezza 1000 BI+Ad Hoc operasyonel analiz Capacity Appliance Sorgulanabilir Arşivlenmiş Yapısal Veri Analizi yapısal veri
  • 32. Big Data Platformu ne yapar? Farklı Çeşitlilikte Veri Analizi Karışık özellikte veriler üzerinde daha önce yapılamayan analizlerin yapılması. Hareketli Bilgi Analizi Yüksek hacimli akan verinin, ad-hoc analizi Çok Yüksek Hacimli Veri Analizi PB ölçeğinde verinin uygun fiat/performans kriterlerinde, analizi Keşfet ve Deneyle Veri üzerinde Ad-hoc analiz, veri keşfi ve deneyleme Yönet ve Planla Veri kurallarını, bütünlüğünü denetleme ve uygulama
  • 33. Tamamlayıcı Analitik Geleneksel Yaklaşım Yeni Yaklaşım Yapısal, Analitik, Mantıksal Yaratıcı, bütünlükçü düşünce, sezgisel Veri Ambarı Hadoop Streams Transaction Data Web Kütükleri Iç Uygulamalar Yapısal Sosyal Veri Structured Yapısal Değil Unstructured Repeatable Kurumsal Exploratory Tekrar edilebilir Mainframe Verisi Linear Entegrasyon Keşfedilebilir Text Veri: eposta Iterative Monthly sales reports Brand sentiment Lineer Profitability analysis OLTP Sistemleri surveys Döngüsel Product strategy Customer Maximum asset utilization imaj Duyarga Verisi: ERP Geleneksel Yeni RFID Kaynaklar Kaynaklar
  • 34. Açık Kaynak Yazılımla iç içe! • Açık Kaynak Topluluğa yıllardır yapılan katkılar - Apache Hadoop ve Jaql, Apache Derby, Apache Geronimo, Apache Jakarta - Eclipse: IBM tarafından kuruldu. - Lucene katıları, IBM Lucene Extension Library (ILEL) kanalı ile... - DRDA, XQuery, SQL, XML4J, XERCES, HTTP, Java, Linux... • Açık kaynak kodlu IBM Yazılımları – WebSphere: Apache – Rational: Eclipse ve Apache – InfoSphere: Eclipse ve Apache • IBM’s BigInsights (Hadoop) is %100 açık kaynak kodlu bir yazılımdır
  • 35. February 2012 “The Forrester Wave™: Enterprise Hadoop Solutions, Q1 2012” Forrester Wave™: Enterprise Hadoop Solutions, Q1 ’2012 Amazon IBM Oracle
  • 36. BIG Data teknolojilerini öğrenmenin eğlenceli ve kolay yolu:  Satıcı bağımsız, topluluk temelli, IBM ve diğer liderler tarafından destekleniyor;  Esnek, çevrim içi eğitimler;  Ücretsiz kurslar ve çalışma materyalleri;  Video destekli, kolay öğrenim olanakları;  Bulut temelli alıştırma imkanları;  14000+ kayıtlı öğrenci.
  • 37. Cüneyt Göksu, VBT IBM Gold Consultant IBM Champion for Data Management 37 Cuneyt.Goksu@vbt.com.tr