Будинки Аудіо Аналіз краю: економіка йоту нарешті

Аналіз краю: економіка йоту нарешті

Anonim

Співробітники компанії «Техопедія», 22 вересня 2016 року

Винос: Ведуча Ребекка Йозв'як обговорює крайню аналітику з докторами Робіном Блором, Дез Бланчфілдом та Шоу Роджерсом Dell Statistica.

На даний момент ви не ввійшли в систему. Будь ласка, увійдіть або зареєструйтесь, щоб переглянути відео.

Ребекка Йозвяк: Пані та панове, привіт, ласкаво просимо до Hot Technologies 2016. Сьогодні у нас є "Edge Analytics: Іонічна економіка нарешті". Мене звуть Ребекка Йозвяк. Я буду вашим модератором сьогоднішньої трансляції. Ми робимо твіт із хештегом # HOTTECH16, якщо ви хочете приєднатися до розмови в Twitter.

Тож IoT, безумовно, гаряча тема цього року та Інтернет речей, це дійсно про дані машини, сенсорні дані, дані журналу, дані пристрою. Жоден з них не є новим, ми мали такий тип даних назавжди, але це те, що ми насправді не змогли ним користуватися, і зараз ми бачимо лише безліч нових способів використання цих даних. Зокрема, в медичній галузі, на фінансових ринках, з нафтою та газом, товарами, це просто безліч інформації, яка раніше не використовувалася. І не дуже багато людей справді зрозуміли, як це зробити добре. Ми говоримо про багато мало даних, але це багато даних, і, знаєте, пов’язані проблеми з мережею, задіяне обладнання або потрібно обробляти, і як це зробити, не забиваючи систему? Ну, про це ми сьогодні дізнаємось.

Ось наш набір експертів. У нас є доктор Робін Блор, наш головний аналітик The Bloor Group. У нас також є Дез Бланчфілд, наш науковий співробітник групи The Bloor. І ми раді, що отримали Шона Роджерса, директора з глобального маркетингу та каналів від Dell Statistica. І з цим я збираюся передати м'яч Робіну.

Доктор Робін Блор: Гаразд, добре дякую за це. Я натискаю кнопку і підкидаю слайд. Я поняття не маю, чому я створив цю апокаліптичну картину для інтернету речей. Можливо тому, що я думаю, що зрештою це стане хаотичним. Я рухатимусь прямо. Це є рівним для курсу в будь-якій презентації IoT. Ви повинні так чи інакше сказати щось нецензурне про те, куди це все йде. І насправді, велика частина цього, мабуть, правда. Якщо ви насправді дивитесь на те, як ці криві поступово розширюються. Знаєте, персональні комп’ютери, смартфони та планшети, ймовірно, продовжать зростати. Смарт-телевізори, ймовірно, підняться. Носяться, вони, ймовірно, вибухають саме зараз, порівняно з тим, що вони були кілька років тому. Підключені автомобілі, неминуче те, що майже всі автомобілі будуть підключені ретельно широкими і ретельно передавати дані весь час. І все інше. І саме цей графік BI Intelligence вказує на те, що все інше буде переважати очевидні речі дуже і дуже швидко.

Отже, що сказати про IoT? Перше - це просто архітектурна точка. Ви знаєте, коли у вас є дані і ви обробляєте вас, так чи інакше, вам доведеться скласти ці два разом. І з даними про обсяги, які зараз є, і збираючись у різних місцях, вони вже, природно, не є разом. Звичайно, вони були в старих мейнфреймів. Таким чином, ви можете думати з точки зору існування рівня обробки, транспортного рівня та рівня даних. Так чи інакше, транспортний шар сьогодні збирається переміщувати обробку або переміщувати дані по всіх мережах. Ось ось вибір: Ви можете перемістити дані в обробку, ви можете перемістити обробку на дані, ви можете перемістити обробку та дані в зручну точку виконання, або ви можете розподілити обробку та розподілити дані. Що стосується Інтернету речей, то дані вже майже заштриховані при народженні, і ймовірність полягає в тому, що жахливу кількість обробки буде оскорблено для того, щоб програми, які потрібно запустити, могли мати місце.

Так я намалював картину. Цікаво мені про IoT, я розповідаю про домен агрегації на цій діаграмі, і я вказую, що є субдомени. Отже, ви можете уявити, що домен IoT 1 тут - машина певного типу, а домен 2 і домен 3 і домен 4 - це машини певного типу, і ви будете агрегувати дані локально, ви будете запускати локальні додатки на цих даних, і ви введете в дію різні речі. Але для того, щоб мати аналітику щодо всіх автомобілів, вам доведеться перенести дані в центр, не обов'язково всі дані, але вам доведеться збирати в центрі. І якщо ви думаєте над цим, то, можливо, ви хочете мати багато, безліч різних доменів агрегації до одного і того ж набору речей IoT. І самі домени можуть додатково агрегуватися. Таким чином, ви могли мати цю повторювану ієрархію. І в основному те, що ми маємо там, надзвичайно складна мережа. Набагато складніший за все, що ми мали раніше.

У мене тут є записка внизу. Усі вузли мережі, включаючи вузли листя, можуть бути творцями даних, сховищами даних та точками обробки. І це дає вам можливість розповсюдження, подібного якого ми ще не бачили. Дез поговорить про це трохи більше, тому я перейду до цієї конкретної точки. Після того, як ми перебуваємо в Інтернеті речей і всі дані насправді вирішили стати подіями, суть цього слайда полягає лише в тому, щоб вказати, що нам доведеться стандартизувати події. Нам доведеться, як мінімум, мати це. Ми будемо мати час, коли відбулася подія, географічне розташування, яке відбулося, віртуальне чи логічне розташування процесу, який його створив, джерело пристрою, який його створив, ідентифікатор пристрою, щоб ви точно знали, який джерело пристрою створив його, право власності даних і суб'єктів, тих людей, які мають право використовувати ті чи інші дані, доведеться мати з собою свої дозволи, а це означає, що справді потрібно мати безпеку, і тоді є самі дані. І коли ви дивитесь на це, то розумієте, що, навіть якщо у вас є датчик, який нічого не робить, ніж повідомляти про температуру чогось щосекунди або близько того, насправді існує досить багато даних, щоб точно визначити, де саме дані виникла і якою вона є насправді. До речі, це не вичерпний перелік.

Отже, з точки зору майбутнього ІТ-ландшафту, я бачу це так: це не лише Інтернет речей, а й факт, що ми будемо у світі діяльності, керованої подіями, і тому ми доведеться мати архітектури, керовані подіями, і ці архітектури повинні будуть охоплювати великі мережі. І інша річ - це все в режимі реального часу, це не обов'язково для нас, щоб ми знаходилися в режимі реального часу, але є те, що я називаю робочим часом, це час, протягом якого фактично потрібно подавати та готові дані обробляти. Це може бути не мілісекунда після його створення. Але завжди є такий час для кожної частини даних, і коли у вас є архітектура, керована подіями, вона стає розумнішою думати з точки зору підходу в реальному часі до того, як працює світ.

Тож збиваючи це, бо те, про що ми говоримо насправді, - це аналітика на IoT. Незважаючи на все це, все ще йде час для розуміння, і це не просто час для прозріння, прозорливість повинна супроводжуватися діями. Отже, час на розуміння і час на дію - це те, до чого я б звів. Сказавши це, я передаю м'яч назад Дезу.

Дез Бланчфілд: Дякую, Робін. Проникливий, як завжди. Мені подобається те, що важко вчинятись у кожному випадку, але я зроблю все можливе.

Одне з речей, які я бачу, і мене це часто розважає, чесно кажучи, і не у відвертому і негативному косому вигляді, але є багато проблем і паніки щодо Інтернету речей, що переймають світ і намічаєте нас, і ви почнете втрачати свої дані, тому я хочу трохи озирнутися на деякі речі, які ми робили раніше за останні два-три десятиліття, які були близьким факсом до Інтернету речей, але, можливо, не зовсім у такому ж масштабі. І просто щоб показати собі, що ми насправді були тут і вирішили деякі проблеми, не на такому рівні масштабів і не з такою швидкістю. Тому що це означає, що ми можемо реально вирішити проблему і що ми знаємо, які відповіді є; ми щойно прийшли вниз і знову застосували деякі знання, які ми мали раніше. І я знаю, що це вся розмова, яку ми збираємось вести, і я отримав цілу низку цікавих речей, щоб просто поговорити в розділі запитань та запитань.

Але коли ми думаємо про Інтернет речей у колі, зараз існує велика централізація на рівні дизайну, про яку писали ще в перші дні. Наприклад, пристрої Fitbit, як правило, відвідують одне центральне місце, і, швидше за все, вони десь будуть розміщені на хмарній платформі, і всі дані, що надходять з усіх цих пристроїв, потрапляють однаково, скажімо так, передній кінець стека, включаючи веб і додатки та послуги на основі даних. Але з часом цей масштаб потребуватиме повторної інженерії, щоб впоратися з кількістю даних, що надходять на них, і вони перероблять інженер, щоб таким чином було безліч передніх кінців і декілька копій стека в декількох місцях і регіонах. І ми бачимо це, і є кілька прикладів, які я надам вам, щоб ми могли обговорити.

Ключовим моментом цього є те, що, хоча ми бачили деякі з цих рішень, які я збираюсь висвітлити, масштаб та обсяг даних та мережевий трафік, який генеруватиме Інтернет, потрібно терміново вимагати переходу від центрального на мій погляд, розподілені архітектури, і ми це знаємо, але ми не обов'язково розуміли, що таке рішення. Коли ми замислюємося над тим, що таке Інтернет в речах, це масштабна мережева модель. Зараз багато-багато речей створюють шум. Те, що до недавнього часу не шумило. І насправді, я думаю, це було вчора, я жартома говорив про штабелі, але я пішов купити новий тостер, і він прийшов з варіантом, який міг би розповісти мені про різні речі, в тому числі, коли потрібне прибирання. І нова мікрохвильова піч з дуже подібною функцією і навіть могла фактично пінг програми на моєму телефоні, щоб сказати, що те, що я розігрівав, зараз зроблено. І я дуже вважаю, що якщо є кілька речей, я не хочу говорити зі мною, це мій холодильник, мікрохвильова піч і тостери. Мені досить комфортно, бо вони німі пристрої. Але нещодавно у мене з’явився новий автомобіль, маленьке Ауді, і воно розмовляє зі мною, і я цілком задоволений цим, бо речі, про які він говорить, - цікаві речі. Як і оновлення карт у режимі реального часу, щоб сказати мені, де є кращий маршрут дістатися з точки А до точки В, оскільки він виявляє трафік за допомогою різних механізмів із отриманими даними.

У мене є цей слайд. Ми вже бачили, що широкомасштабні мережеві моделі вимагають переходу від центрального до розподіленого збору та доставки моделей обробки та аналізу даних. Ми бачили, як все переміщується з трьох маленьких графічних діаграм там, на правій грані, де у нас є, ліва з трьох, є централізована модель, коли всі маленькі пристрої підходять до центрального місця та збирають дані, і масштаб не настільки великий, вони там прекрасно справляються. У середині у нас є дещо децентралізованіша модель і концентратор, і це саме те, що, на мою думку, нам знадобиться в Інтернеті речей наступного покоління. І тоді, з правого боку, у нас є ця повністю розподілена і з’єднана мережа, в якій в майбутньому в Інтернеті речей і машин до машини буде впроваджено дуже короткий термін, але ми не дуже туди з ряду причин. І, головним чином, тому, що ми використовуємо Інтернет-платформи для більшості комунікацій до цих пір, і ми фактично не побудували другу мережу для передачі багатьох цих даних.

Є другі мережі, які вже існують, наприклад, мережа Batelco. Дуже багато людей не замислюються над тим, що мережі телекомунікацій не є Інтернетом. Інтернет багато в чому дуже окрема річ. Вони спрямовують дані зі смартфонів по телефонних мережах, а потім по телефонних мережах та в Інтернеті взагалі там, де вони насправді розміщують їх у двох мережах. Але цілком можливо та ймовірно, що Інтернет речей потребує іншої мережі. Ми говоримо про промисловий Інтернет як про тему, про яку ми зараз не будемо детально розбиратися, але, по суті, ми говоримо про іншу мережу, спеціально розроблену для типів перевезення даних або Інтернету речей і машинних машин. спілкування.

Але деякі приклади, якими я хотів поділитися, де ми бачили великі обсяги мереж і розподілені дані дуже добре працюють, такі речі, як Інтернет. Інтернет був спеціально розроблений та сконструйований з першого дня, щоб він зміг пережити ядерну війну. Якщо частини США підірвані, Інтернет був розроблений таким чином, щоб дані могли переміщатися по Інтернету без втрати пакетів з причин, які ми все ще пов'язані. І це існує і сьогодні в глобальному масштабі. Інтернет має багато можливостей навколо пакетів надмірності та маршрутизації. Насправді Інтернет, який контролюється дією під назвою BGP, Border Gateway Protocol та BGP, BGP, спеціально розроблений для того, щоб справлятися з тим, що маршрутизатор або комутатор або сервер перебувають вниз. Коли ви надсилаєте або отримуєте електронний лист, якщо ви надсилаєте три електронні листи підряд, немає гарантії, що кожен з цих листів буде слідувати тим же маршрутом до того самого кінцевого пункту призначення. Вони можуть переходити через різні частини Інтернету з різних причин. Можливо, може бути відключення, можуть бути вікна технічного обслуговування, де все в режимі офлайн потрібно оновити, може бути просто затори в мережі, і ми бачимо, що з такими речами, як транспортні мережі з автомобілями та громадським транспортом, суднами та літаками. Ми отримуємо контент на наші пристрої, такі як наші ноутбуки та планшети та комп’ютери через браузери тощо, щодня через мережі доставки вмісту. Мережі доставки вмісту - це отримання копій вмісту з вашої основної платформи обслуговування, наприклад веб-сервера, переміщення копій цього та кеш-пам'яті невеликої кількості до краю мережі та доставки їх лише з найближчої частини краю.

Захист від спаму та кібербезпеки - якщо подія спаму відбувається в Канаді, і Microsoft виявляє її і бачить, що групі випадкових людей надсилається багато копій одного і того ж електронного листа, на це приймаються контрольні суми, підпис для цього повідомлення є створено та введено в мережу та розповсюджено негайно. І щоб ця електронна пошта ніколи не потрапляла у мою вхідну скриньку, або, якщо вона є, вона негайно позначається як спам, оскільки її виявлено десь в краю мережі. І тому інші частини краю мережі повідомляються про цей підпис спам-повідомлення, і він вкладається в індекс бази даних, і якщо ці повідомлення починають з’являтися на іншій частині планети, ми виявляємо їх і знаємо, що вони спам. І те саме стосується і кібербезпеки. Хак, який відбувається на одній стороні планети, виявляється і реєструється і відображається на карті, і раптом в іншій частині мережі ми можемо боротися з ним, подавати правила та політику та змінювати, щоб побачити, чи можемо ми її заблокувати. Зокрема, з новим впливом таких речей, як відмова в обслуговуванні або розподілене відмову в обслуговуванні, коли тисячі машин використовуються для атаки на центральний веб-сайт.

Біткойн і блокчейн за замовчуванням є за своєю суттю розподіленою книгою, блокчейном і справляється з будь-якими відключеннями або поломками в мережі. Виявлення та запобігання шахрайству, енерго- та водопостачання - ми бачимо, ви знаєте, електромережа, якщо одна частина мережі потрапить на неї на дерево і витягне полюс і дріт, мій будинок все одно отримує живлення. Я про це навіть не знаю, часто навіть не бачу цього в новинах. І всі ми звикли до транспортних мереж, де спочатку існувала централізована модель: «Всі дороги вели до Риму», як кажуть, а потім, врешті-решт, нам довелося перейти до децентралізованої моделі з маточинами і спицями, а потім ми поїхали до сітчастої мережі, де можна було дістатися з одного боку міста на інший через різні сітчасті маршрути та різні перехрестя. І тому, що ми бачимо тут, це те, що ця централізована модель того, що ми зараз робимо з Інтернетом речей, повинна буде висуватися на край мережі. І це стосується аналітики як ніколи, і це те, що нам потрібно висувати аналітику в мережу. Для цього потрібен абсолютно новий підхід у тому, як ми отримуємо доступ та обробляємо ці дані та потоки даних, на мій погляд. Зараз ми говоримо про сценарій, коли, на мою думку, ми бачимо обмежений інтелект, висунутий на край мережі на підключених до Інтернету пристроях, але незабаром ми побачимо, що ці пристрої збільшують інтелект та підвищують рівень аналітики, який вони хочуть зробити. І внаслідок цього нам потрібно буде витісняти ці розумні можливості все далі та далі через мережу.

Наприклад, смарт-програми та соціальні медіа - якщо ми думаємо про соціальні медіа та деякі розумні додатки, вони все ще дуже важливі. Знаєте, у Facebook є лише два-три центри обробки даних. Google отримав набагато децентралізацію, але все ще існує обмежена кількість центрів обробки даних по всьому світу. Тоді, коли ми думаємо про персоналізацію вмісту, вам доведеться продумати дуже локальний рівень. Багато що робиться у вашому веб-переглядачі або на локальному рівні доставки вмісту. І ми думаємо про відстеження здоров’я та фітнесу - багато даних, які збираються з них, аналізуються локально, і тому нові версії пристроїв Garmin та Fitbit, які ви надягаєте на зап’ястя, стають розумнішими та розумнішими у пристрої . Тепер вони не надсилають всі дані про серцебиття назад на централізований сервер, щоб спробувати зробити аналітику; вони вбудовують цей інтелект безпосередньо в пристрій. У автомобільній навігації раніше було так, що автомобіль постійно отримуватиме оновлення та карти з центрального місця, тепер розумники знаходяться в машині, і машина приймає рішення все сама, і врешті-решт машини будуть сіткою. Автомобілі будуть спілкуватися один з одним за допомогою бездротових мереж якоїсь форми, що може бути над 3G або бездротовою мережею 4G наступного покоління, але з часом це буде пристрій для пристрою. І єдиний спосіб ми впораємося з обсягом цього - зробимо пристрої розумнішими.

У нас вже є системи попередження про надзвичайні ситуації, які збирають інформацію на місцях і надсилають її централізовано або в сітчасту мережу та приймають рішення про те, що відбувається локально. Наприклад, в Японії є додатки, які люди працюють на своїх смартфонах з акселерометрами в смартфоні. Акселерометри в смартфоні визначатимуть вібрації та рух і можуть визначити різницю між звичайним щоденним рухом та тремтінням та ударами землетрусу. І цей телефон почне попереджати вас негайно, локально. Фактична програма знає, що вона виявляє землетруси. Але він також ділиться цими даними через мережу в розподіленому концентраторі та моделях, щоб людей, які знаходяться поруч, отримували попередження негайно або якнайшвидше, як дані проходять через мережу. І тоді врешті-решт, потрапляючи до центрального місця чи розповсюдженої копії центрального місця, він відштовхує людей, які не знаходяться в найближчій зоні, не виявили руху планети, але про це потрібно попередити, тому що можливо, настає цунамі.

І інфраструктура розумного міста - концепція інтелектуальної інфраструктури, ми вже вбудовуємо інтелект у розумні будівлі та розумну інфраструктуру. Насправді вчора я припаркував свій автомобіль у місті на новому районі, де частина міста відремонтувалась та відбудовувалася. І вони переробили всі вулиці, і на вулицях є датчики, і власне лічильник паркування знає, що коли я заїхав з машиною, він знає, що коли я їду поновитись на дві години обмеження, машина не рухалася, і насправді вона не дозволила мені долетіти і залишитися ще дві години. Мені довелося сісти в машину, витягнути місце і потім потягнути назад, щоб обдурити це, щоб я міг залишитися там ще дві години. Але що цікаво, це те, що зрештою ми йдемо до того, що це не просто виявлення автомобіля, що заходить у зону як локалізований датчик, але такі речі, як оптичні характеристики, де розпізнавання буде застосовано за допомогою камер, що дивляться на мій номерний знак, і це буде знати що я насправді просто витягнув і повернув назад і обдурив це, і це просто не дозволить мені поновитись, і я рухатимусь далі. І тоді він поширюватиме ці дані та переконуватиметься, що я не можу цього робити більше ніде та накручувати мережу на постійній основі. Тому що це, за своєю природою, має бути розумнішим, інакше ми все продовжимо його дурити.

Є приклад цього, що я насправді особисто жив там, де в технології брандмауера, наприкінці 80-х та на початку 90-х, був продукт, який називався Check Point FireWall-1. Дуже проста технологія брандмауера, яку ми використовували для створення правил і побудови політики та правил навколо певних речей, щоб сказати, що типи трафіку через певні порти та IP-адреси та мережі, щоб дістатися до одного та один від одного, веб-трафік з одного місця в інше, перехід від кінця браузера та клієнта до нашого сервера. Ми вирішили цю проблему, фактично вийнявши логіку з самих брандмауерів і фактично перемістивши її в ASIC, специфічну для програми інтегральну схему. Це було управління портами в Ethernet комутаторах. Ми виявили, що серверні комп’ютери, комп’ютери, які ми насправді використовували як сервери для прийняття рішень як брандмауери, не були достатньо потужними, щоб обробляти об'єм трафіку, що проходить через них, для кожного невеликого огляду пакетів. Ми вирішили цю проблему, перемістивши логіку, необхідну для перевірки пакетів та виявлення Інтернету, в мережеві комутатори, які були розподілені та здатні обробляти об'єм даних, що проходять через мережевий рівень. Ми не турбувались про це на централізованому рівні за допомогою брандмауерів, ми перенесли його на комутатори.

І тому нам довелося виробникам створити можливість просувати шляхи, правила та політику в перемикач Ethernet, щоб фактичний рівень порту Ethernet і, можливо, багато людей у ​​пулі не були з цим знайомі, тому що ми Зараз усі живуть у бездротовому світі, але колись усе довелося підключати через Ethernet. Тепер на рівні порту Ethernet ми проводили перевірку пакетів, щоб побачити, чи дозволяли пакетам навіть переходити в комутатор і в мережу. Дещо з цього, що ми вирішуємо зараз, вирішуючи цю проблему збору даних у мережі, зокрема з пристроїв IRT, а також їх перевірки та аналізу, а також, можливо, аналітики в реальному часі для прийняття рішень. І деякі з них - це отримати уявлення про бізнес-аналітику та інформацію про те, як люди приймають кращі рішення та іншу аналітику та ефективність для матеріалів на рівні машини-машини, де пристрої спілкуються з пристроями та приймають рішення.

І це буде тенденцією, яку нам доведеться розглядати у найближчому майбутньому, тому що якщо цього не зробити, ми просто закінчимося цим потоком шуму. І ми бачили у світі великих даних, ми бачили, як озера даних перетворюються на болота даних, що ми лише закінчуємось шумом, який ми не зрозуміли, як вирішити аналітику обробки в централізованому режимі. мода. Якщо ми не вирішимо цю проблему, на мою думку, з IoT негайно і отримаємо рішення платформи дуже швидко, ми опинимося в дуже, дуже поганому місці.

І маючи це на увазі, я збираюся завершити свою думку, яка полягає в тому, що я вважаю, що одна з найбільших змін, що відбувається в просторі великих даних і аналітики, визначається негайною необхідністю реагувати на вплив Інтернету з речей з великої та об'ємної аналітики в реальному часі, оскільки нам потрібно перенести аналітику в мережу, а потім, зрештою, на край мережі, щоб просто впоратися із сумарним обсягом її, просто обробити її. А потім, сподіваємось, ми розмістили інтелект в мережу та край мережі в хабі і говорили модель, що ми можемо реально керувати нею і отримувати уявлення в реальному часі і отримувати від цього цінність. І з цим я збираюся перейти до нашого гостя і подивитися, куди нас веде ця розмова.

Шон Роджерс: Дуже дякую. Це Шон Роджерс від Dell Statistica, і хлопчик, для початку я повністю згоден з усіма основними темами, які тут торкалися. І Ребекка, ви почали займатися ідеєю, ви знаєте, ці дані не нові, і мені чудово, скільки часу і енергії витрачається на обговорення даних, даних, даних IoT. І це, безумовно, актуально, ви знаєте, Робін зробив добру думку, навіть якщо ви робите щось по-справжньому просто і ви один раз в секунду забираєтеся в термостат, знаєте, ви робите це 24 години на день, і насправді у вас є Ви знаєте, кілька цікавих викликів даних. Але, знаєте, врешті-решт, - і я думаю, що багато людей в галузі говорять про дані таким чином - що це насправді не все так цікаво, і, на думку Ребекки, це було вже довгий час, але ми в минулому не змогли нею скористатися. І я думаю, що передова аналітична індустрія та індустрія BI взагалі починають по-справжньому повертати голову до IoT. І Дез, на ваш остаточний пункт, я вважаю, що це частина або одна із складних точок пейзажу великих даних, я думаю, що це дуже правда. Я думаю, що всі дуже схвильовані щодо того, що ми можемо зробити з цим типом даних, але в той же час, якщо ми не можемо розібратися, як застосувати розуміння, вжити заходів і, знаєте, отримати аналітику, де дані, я думаю перед нами будуть проблеми, які люди не бачать, як насправді приходить їхній шлях.

Зважаючи на це, в просторі розширеної аналітики ми є великими шанувальниками того, що, на нашу думку, може статися з даними IoT, особливо якщо ми застосовуємо аналітику до цього. На цьому слайді є багато інформації, і я дозволяю всім просто полювати і клювати, але якщо ви подивитеся на різні сектори, наприклад, роздрібний продаж у крайній правій частині, побачите їхню можливість, яка виникає навколо того, щоб бути більш інноваційним або мати якийсь економія витрат або оптимізація або покращення процесів є дуже важливими, і для них багато випадків використання. Якщо ви подивитеся, знаєте, зліва направо через слайд, ви побачите, як кожна з цих галузей вимагає нових можливостей та нових можливостей для себе, коли вони застосовують аналітику до IoT. І я думаю, що підсумок полягає в тому, що якщо ви будете намагатися піти вниз по цьому шляху, ви повинні не тільки турбуватися про дані, як ми обговорювали, та архітектуру, але ви також повинні дивитись, як найкраще застосуйте аналітику до неї та там, де аналітика має відбутися.

Ми знаємо, що багато хто з сьогоднішніх дзвінків ми з Робіном знали один одного дуже давно і в минулому вели чимало розмов про традиційні архітектури, про централізовані бази даних або на сховищах даних про підприємство тощо, і як ми ' Ви знайшли за останнє десятиліття або близько того, ми робимо досить непогану роботу з розтягування обмежень цих інфраструктур. І вони не такі стійкі або настільки сильні, як ми хотіли б, щоб вони були сьогодні, щоб підтримати всю чудову аналітику, яку ми застосовуємо до інформації, і, звичайно, інформація також порушує архітектуру, швидкість даних, обсяг даних тощо, безумовно, розтягують обмеження деяких наших більш традиційних підходів і стратегій до цього виду роботи. І тому я думаю, що це якось починає вимагати від компаній сприйняття більш гнучкої та, можливо, гнучкішої точки зору на це, і це, напевно, я хотів би поговорити про трохи навколо IoT.

Перш ніж я це зробити, я знайду хвилинку, щоб дозволити всім дзвонити, дати вам трохи інформації про те, що таке Statistica та що ми робимо. Як видно з назви цього слайда, Statistica - це прогностична аналітика, великі дані та візуалізація для платформи IoT. Самому продукту трохи більше 30 років, і ми конкуруємо з іншими лідерами на ринку, з якими ви, напевно, знайомі завдяки можливості передбачуваної аналітики, розширеної аналітики до даних. Ми побачили можливість розширити сферу своєї діяльності, де ми вкладаємо свою аналітику, і почали працювати над деякими технологіями назад, які позиціонували нас досить добре, щоб скористатися тим, про що говорили і Дез, і Робін сьогодні, що це новий підхід і куди ви збираєтеся помістити аналітику і як ви збираєтеся зв'язати її з даними. Поряд із цією стороною є інші речі, з якими ви маєте змогу вирішувати платформу, і, як я вже згадував, Statistica була дуже довго на ринку. Ми дуже добре підходимо до речей, що поєднують дані, і я думаю, ви знаєте, ми сьогодні не надто багато говорили про доступ до даних, але про те, щоб отримати доступ до цих різноманітних мереж і отримати ваші потрібні дані на правильний час стає все більш цікавим і важливим для кінцевих користувачів.

Нарешті, я прокоментую тут ще один фрагмент, адже Dez зробив хороший підсумок щодо самих мереж, маючи певний рівень контролю та безпеки над аналітичними моделями у вашому оточенні та як вони приєднуються до того, що дані стають дуже важливими. Коли я кілька років тому потрапив у цю галузь - майже 20, думаю, - коли ми говорили про сучасну аналітику, це було дуже кураційно. Лише пару людей в організації мали свої руки, вони розгорнули її, і вони дали відповіді людям у міру необхідності або надали інформацію, як потрібно. Це дійсно змінюється, і те, що ми бачимо, - це багато людей, які працювали з одним або декількома різноманітними та гнучкішими способами доступу до даних, застосовуючи до них безпеку та управління, а потім змогли співпрацювати над ними. Це деякі важливі речі, на які дивиться Dell Statistica.

Але я хочу зануритися в тему, трохи ближчу до сьогоднішньої назви, яка полягає в тому, як нам звертатися до даних, які надходять з Інтернету речей, і що ви, можливо, хочете шукати, шукаючи різні рішення. Слайд, який я зараз підняв перед вами, є своєрідним традиційним видом, і Дез, і Робін начебто торкнулися цього, ви знаєте, цієї ідеї розмови з датчиком, будь то автомобіль чи тостер або вітрогенератор, чи що у вас є, а потім переміщуйте ці дані з джерела даних у вашу мережу назад до централізованого типу конфігурації, як згадував Дез. І це мережа досить добре, і багато компаній, які потрапляють в простір IoT, спочатку починають це робити з цією моделлю.

Інша річ, якщо ви подивитеся на нижню частину слайда, - це ідея взяти інші традиційні джерела даних, збільшити ваші дані IoT, а потім на такому ядрі, чи буде ваше ядро ​​центром обробки даних чи це може бути в хмарі, це насправді не має значення, ви б взяли такий продукт, як Statistica, а потім застосували до нього аналітику, а потім надасте спостереження споживачам праворуч. І я думаю, що це настільні ставки на даний момент. Це те, що ви повинні вміти, і вам потрібно мати достатньо відкриту архітектуру для розширеної аналітичної платформи та спілкуватися з усіма цими, різними, різноманітними джерелами даних, усіма цими датчиками та всіма цими різними напрямами, де у вас є дані. І я думаю, що це те, що ви повинні вміти робити, і я думаю, що ви вважаєте, що це правда, що багато лідерів на ринку здатні робити такі речі. Тут, у Statistica, ми говоримо про це як про основну аналітику. Перейдіть, отримайте дані, поверніть їх до ядра, обробіть їх, додайте більше даних, якщо це необхідно або якщо це вигідно, і зробіть свою аналітику, а потім поділіться цією інформацією для дії або для ознайомлення.

І тому я думаю, що це, безумовно, з позицій функції, ми, мабуть, всі погоджуємось, що, знаєте, це є найголовніша необхідність, і всі повинні це робити. Там, де починає цікаво, це те, де у вас є величезна кількість даних, ви знаєте, виходячи з різних джерел даних, таких як датчики IoT, як я вже згадував, будь то машина, камера безпеки або виробничий процес, там починає ставати перевага в тому, що можна робити аналітику там, де фактично виробляються дані. І перевага для більшості людей, я думаю, коли ми починаємо переміщати аналітику від ядра до краю, - це здатність розповсюдження деяких викликів даних, які відбуваються, і Дез і Робін, ймовірно, прокоментують це наприкінці сьогодні, але я думаю, що ви повинні мати можливість контролювати та вживати заходів щодо даних на краю, щоб не завжди потрібно переміщувати всі ці дані у вашу мережу. Робін розповів про це у своїй, свого роду, архітектурній картині, яку він склав, де у вас є всі ці різні джерела, але зазвичай є якась сукупність. Точка агрегації, яку ми бачимо досить часто, знаходиться або на рівні датчика, але ще частіше на рівні шлюзу. І ці шлюзи існують як свого роду посередник у потоці даних із джерел даних, перш ніж повернутися до основної суті.

Однією з можливостей, якими скористався Dell Statistica, є те, що наша можливість експортувати модель з нашої централізованої розширеної аналітичної платформи, щоб мати можливість взяти модель, а потім виконати цю модель на краю на іншій платформі, як шлюз або всередині бази даних або що у вас є. І я думаю, що гнучкість, яку нам надає, є те, що насправді цікавим моментом сьогоднішньої розмови, чи є у вас сьогодні її інфраструктура? Чи можете ви перенести аналітику туди, де дані живуть, а не просто переміщувати дані туди, де живе ваша аналітика? І це те, на що Statistica фокусується вже досить давно, і коли ви придивитеся до слайдів, ви побачите, що там є якась інша технологія від нашої сестринської компанії Dell Boomi. Платформа інтеграції даних та інтеграції додатків Dell Boomi у хмарі, і ми фактично використовуємо Dell Boomi як пристрій для торгівлі людьми для переміщення наших моделей з Dell Statistica, через Boomi і від крайніх пристроїв. І ми думаємо, що це спритний підхід, до якого компанії вимагатимуть вимогливості, настільки, як їм подобається версія, яку я вам показав хвилину тому, яка є якоюсь основною ідеєю переміщення даних від датчиків аж до повернення Центр, в той же час компанії хочуть зробити це так, як я тут щось накреслюю. І переваги для цього полягають у деяких моментах, які зробили і Робін, і Дез, а саме: чи можете ви прийняти рішення та вжити заходів у швидкість вашого бізнесу? Чи можете ви переміщувати аналітику з одного місця в інше і чи зможете заощадити собі час, гроші та енергію та складність постійного переміщення цих крайових даних назад до ядра.

Тепер я перший сказав, що деякі крайні дані завжди матимуть високу заслугу, де було б сенс зберігати ці дані та зберігати їх та повертати їх у вашу мережу, але яка крайна аналітика дозволить вам чи це здатність приймати рішення зі швидкістю, до якої фактично надходять дані, правда? Щоб ви могли застосувати прозріння та дію зі швидкістю там, де найвище можливе значення. І я думаю, що це те, що ми всі будемо шукати, коли мова йде про використання передової аналітики та даних IoT, - це можливість рухатися зі швидкістю бізнесу або зі швидкістю, якої вимагає клієнт. Я думаю, що наша позиція полягає в тому, що я думаю, що вам потрібно вміти робити і те, і інше. І я думаю, що досить скоро і дуже швидко, оскільки все більше компаній розглядають різноманітні набори даних, особливо ті, що стосуються IoT, вони почнуть дивитись на простір постачальників і вимагати того, на що здатна Statistica. Що полягає в тому, щоб розгорнути модель в основі, як це робимо традиційно протягом багатьох років, або розгорнути її на платформах, які, можливо, нетрадиційні, як шлюз IoT, і насправді мати можливість оцінювати та застосовувати аналітику до даних на межі по мірі отримання даних. І я думаю, що саме тут входить захоплююча частина цієї розмови. Тому що, коли ми можемо застосувати аналітику на краю в момент, коли дані виходять з датчика, дозволяє нам вжити заходів так швидко, як нам потрібно, але також дозволяє нам вирішити, чи потрібно ці дані негайно повертатись до ядра? Чи можемо ми запустити його сюди, а потім відправити назад по шматочках і частинах і пізніше зробити аналіз? І це те, що ми бачимо багато наших провідних клієнтів.

Так, як це робить Dell Statistica, ми маємо можливість використовувати, тому скажімо, наприклад, ви будуєте нейронну мережу всередині Statistica, і ви хотіли поставити нейронну мережу де-небудь ще у вашому ландшафті даних. У нас є можливість вивести ті моделі та всі мови, які ви помітили в правому куті там - Java, PPML, C і SQL і так далі, ми також включаємо Python і ми також можемо експортувати наші сценарії - і, як ви переміщуєте цю платформу з нашої централізованої платформи, ви можете потім розгорнути цю модель або той алгоритм, де вам це потрібно. І як я вже згадував раніше, ми використовуємо Dell Boomi, щоб розмістити її і припаркувати там, де нам потрібно запустити її, і тоді ми можемо повернути результати, або ми можемо допомогти повернути дані назад, або зарахувати дані та вжити заходів, використовуючи нашу систему управління правилами . Усі ці речі стають начебто важливими, коли ми починаємо дивитися на цей тип даних і думаємо знову.

Це те, що більшості з вас по телефону доведеться робити, тому що це стане дуже дорогим і оподаткування вашої мережі, як згадував Dez, для переміщення даних зліва від цих діаграм праворуч від цих діаграм. час. Це не дуже схоже, але ми бачили виробничих замовників з десятьма датчиками на своїх фабриках. І якщо у вас на заводі десять тисяч датчиків, навіть якщо ви просто робите ці випробування або сигнали другого типу, ви говорите про вісімдесят чотири тисячі рядків даних з кожного з цих окремих датчиків на день. І тому дані безумовно накопичуються, і Робін це згадав про це. Наперед я згадав про пару галузей, де ми бачимо, як люди отримують цікаві речі, використовуючи наше програмне забезпечення та дані IoT: автоматизація будівництва, енергетика, комунальні послуги - це дійсно важливий простір. Ми бачимо, що проводиться багато роботи з оптимізації системи, навіть обслуговування клієнтів і, звичайно, загальної експлуатації та обслуговування, в енергетичних об'єктах і в будівлі для автоматизації. І ось деякі випадки використання, які ми бачимо, є досить потужними.

Ми займалися кращою аналітикою раніше, мабуть, термін був придуманий. Як я вже згадував, ми маємо глибокі корені у Statistica. Компанія була заснована майже 30 років тому, тому у нас клієнти повертаються досить довго, які інтегрують дані IoT зі своєю аналітикою і вже деякий час. А Alliant Energy - це один із наших випадків використання або довідкових споживачів. І ви можете уявити собі проблему енергетичної компанії з фізичною установкою. Масштабування за цегляними стінами фізичної установки важко, тому енергетичні компанії, такі як Allian, шукають способів оптимізувати свій енерговипуск, в основному підвищуючи їх виробничий процес і оптимізуючи його до найвищого рівня. І вони використовують Statistica для управління печами у своїх закладах. І для всіх нас, хто повертається до наших ранніх часів на уроках науки, ми всі знаємо, що в печах роблять тепло, тепло робить пар, турбіни крутяться, ми отримуємо електрику. Проблема для компаній, таких як Alliant, насправді полягає в оптимізації того, як все нагрівається і горить у цих великих циклонових печах. І оптимізація випуску, щоб уникнути зайвих витрат на забруднення, витіснення вуглецю тощо. Отже, ви повинні мати можливість контролювати внутрішню частину однієї з цих циклонних печей з усіма цими пристроями, датчиками, а потім приймати всі ці дані датчиків і постійно змінювати енергетичний процес. І саме це Statistica робила для Allian приблизно з 2007 року, перш ніж навіть термін IoT був дуже популярним.

На думку Ребекки рано, дані, безумовно, не нові. Можливість її обробляти та правильно використовувати - це справді там, де відбуваються захоплюючі речі. Сьогодні ми дещо поговорили про охорону здоров'я, і ​​сьогодні ми бачимо всілякі програми для людей, які допомагають покращити догляд за пацієнтами, профілактичне обслуговування, управління ланцюгами поставок та ефективність роботи в галузі охорони здоров’я. І це вже триває, і існує маса різних випадків використання. Ми дуже пишаємось тут у Statistica - це наш замовник Shire Biopharmaceuticals. А Шир виготовляє спеціальні препарати для дійсно важких для лікування захворювань. І коли вони створюють партію ліків для своїх клієнтів, це надзвичайно дорогий процес і цей надзвичайно дорогий процес також вимагає часу. Коли ви думаєте про виробничий процес, як бачите, проблеми є об'єднанням усіх даних, достатньо гнучкими для різних способів введення даних у систему, валідацією інформації та можливістю прогнозування того, як ми допомагаємо цьому клієнту. І процеси, які витягували більшу частину інформації з наших виробничих систем, і, звичайно, пристроїв та датчиків, які керують цими виробничими системами. І це чудовий випадок, коли компанії уникають втрат та оптимізують свої виробничі процеси, використовуючи комбінацію сенсорних даних, даних IoT та звичайних даних із своїх процесів.

Отже, ви знаєте, хороший приклад того, де виробництво, і особливо високотехнологічне виробництво, приносять користь галузі охорони здоров’я навколо цього виду робіт та даних. Я думаю, що у мене є лише декілька інших моментів, які я хотів би зробити, перш ніж загорнути його і повернути Дезу та Робіну. Але ви знаєте, я думаю, що ця ідея здатності просунути свою аналітику кудись у вашому оточенні - це те, що стане надзвичайно важливим для більшості компаній. Якщо ви прив'язані до традиційного формату ETL-ing даних із джерел назад до центральних місць, завжди буде місце у вашій стратегії, але це не повинно бути вашою єдиною стратегією. Сьогодні ви повинні скористатися набагато гнучкішим підходом до речей. Для того, щоб застосувати безпеку, про яку я згадував, уникайте оподаткування вашої мережі, щоб мати можливість керувати та фільтрувати дані, оскільки вони надходять з краю, та визначати, які дані варто зберігати на тривалий термін, які дані варто перенести через до нашої мережі, або які дані просто потрібно проаналізувати під час їх створення, щоб ми прийняли найкращі можливі рішення. Цей аналітичний підхід скрізь і де завгодно - це те, що ми дуже сприймаємо у Statistica, і це те, в чому ми дуже досвідчені. І це повертається до одного з тих слайдів, про які я згадував раніше, можливості експортувати ваші моделі на різних мовах, щоб вони могли співставлятись і вирівнюватися з платформами, де створюються дані. І тоді, звичайно, є розподільний пристрій для тих моделей, який також є щось, що ми подаємо до столу, і що ми дуже раді. Я думаю, що сьогодні розмова полягає в тому, що якщо ми дійсно будемо серйозно ставитися до цих даних, які досить довго існують у наших системах, і ми хотіли б знайти конкурентну перевагу та інноваційний кут для їх використання, ви повинні застосувати якась технологія, яка дозволяє вам відійти від деяких обмежувальних моделей, якими ми користувалися в минулому.

Знову ж таки, моя думка полягає в тому, що якщо ви збираєтеся робити IoT, я думаю, ви повинні мати можливість це зробити в основі, а також вносити дані і співставляти їх з іншими даними та робити свою аналітику. Але також не менш важливо або, можливо, навіть важливіше, ви повинні мати цю гнучкість, щоб розмістити аналітик з даними та перемістити аналітику з центральної сторони вашої архітектури на край для переваг, про які я згадав раніше. Це трохи про те, хто ми є і що робимо на ринку. І ми дуже схвильовані щодо IoT, ми вважаємо, що це, безумовно, старіє, і тут є чудові можливості, щоб усі могли впливати на свою аналітику та критичні процеси за допомогою цього типу даних.

Ребекка Йозвяк: Шон, велике спасибі, що це було справді фантастичне представлення. І я знаю, що Дез, мабуть, вмирає, щоб задати тобі кілька питань, так що Дез, я відпущу тебе першим.

Дез Бланчфілд: У мене мільйон питань, але я вміщу себе, бо знаю, що і у Робіна буде. Одне з речей, які я бачу далеко і широко, - це питання, яке виникає, і я дуже хочу ознайомитися з вашим досвідом в цьому, враховуючи, що ви маєте рацію в серці речей. Організації борються з викликом, і, дивіться, деякі з них щойно прочитали подоба Клауса Шваба «Четверта промислова революція», а потім зазнали панічної атаки. А ті, хто не знайомий з цією книгою, це, по суті, розуміння джентльменів Клауса Шваба, який, на мою думку, є професором, який є засновником і виконавчим головою Світового економічного форуму на згадку, і книга, по суті, про весь цей повсюдний Інтернет вибуху речей та деякого впливу на світ загалом. Організації, з якими я розмовляю, не впевнені, чи варто їм переробити поточне середовище чи все вкласти у створення нових середовищ, інфраструктури та платформ. Також у Dell Statistica ви бачите людей, що переоблаштовують поточні середовища та розгортають вашу платформу в існуючу інфраструктуру, чи ви бачите, як вони перекладають свою увагу на створення всієї нової інфраструктури та готуються до цього потопу?

Шон Роджерс: Ви знаєте, у нас була можливість обслуговувати обидва типи клієнтів і перебуваючи на ринку, поки у нас є, ви отримуєте ці можливості, начебто, широкі. У нас є клієнти, які створили абсолютно нові фабрики за останні кілька років і оснастили їх даними сенсорів, IoT, аналітикою від кінця до кінця протягом усього цього процесу. Але я мушу сказати, що більшість наших клієнтів - це люди, які певний час займаються цим видом праці, але змушені ігнорувати ці дані. Ви знаєте, Ребекка зробила крапку прямо вперед - це не нові дані, такий тип інформації дуже довго був доступний у безлічі різних форматів, але там, де проблема пов’язана з цим, переміщаючи його, перевозячи його кудись, де можна було зробити щось розумне з ним.

І тому я б сказав, що більшість наших клієнтів дивляться на те, що вони мають сьогодні, і Дез, ви раніше зазначали це, що це частина тієї революції великих даних, і я думаю, що це насправді, це все революція даних, правда? Нам більше не потрібно ігнорувати певні системні дані або виробничі дані чи дані автоматизації побудови, тепер у нас є правильні іграшки та інструменти, щоб їх отримати, а потім робити з ними розумні речі. І я думаю, що в цьому просторі багато водіїв, які роблять це, і деякі з них є технологічними. Ви знаєте, рішення інфраструктури великих даних, як Hadoop та інші, дещо з нас зробили це трохи дешевше і трохи легше задуматися про створення озера даних такого типу інформації. І ми зараз дивимось навколо підприємства, щоб піти: "Ей, у нас є аналітика в нашому виробничому процесі, але чи вони будуть вдосконалені, якби ми могли додати трохи розуміння цих процесів?" І це, я думаю, що найбільше наші клієнти роблять. Це не стільки створення «з нуля», скільки розширення та оптимізація аналітики, яка вже є, з новими для них даними.

Дез Бланчфілд: Так, у деяких найбільших галузях, які ми бачили, і ви вже згадали, енергетика та комунальні послуги переживають деякі захоплюючі речі. Авіація якраз переживає цей бум, коли один із моїх улюблених за весь час улюблених пристроїв, про які я регулярно говорю, Boeing 787 Dreamliner та, звичайно, еквівалент Airbus, A330 пішов тим самим маршрутом. Коли вперше було випущено 787 датчиків, було як шість тисяч датчиків, і я думаю, що зараз вони говорять про п'ятнадцять тисяч датчиків у новій версії. І найцікавішим, що розмовляти з деякими людьми, які перебувають у тому світі, було те, що ідея поставити датчики в крила тощо, і дивовижна річ про 787 на дизайнерській платформі полягає в тому, що, знаєте, вони все винаходили в літак. Як і крила, наприклад, коли літак знімає крила, прогинаються до дванадцяти з половиною метрів. Але в крайностях крила можуть прогинатися на кінчику до 25 метрів. Ця штука виглядає як птах, що плескає. Але те, що вони не встигли виправити, - це інженерія аналітики всіх цих даних, тож у них є датчики, які змушують світлодіоди блимати зеленими та червоними, якщо трапляється щось погане, але насправді вони не мають глибокого розуміння реальний час. І вони також не вирішили проблеми, як переміщувати об'єм даних навколо, оскільки у вітчизняному повітряному просторі в США щодня є 87 400 рейсів. Коли кожен літак наздоганяє свої викупи 787 Dreamliner, це 43 петабайта в день, оскільки ці літаки зараз створюють близько половини терабайт даних. А коли ви помножите 87 400 польотів на добу у США на п’ять або половину терабайт, ви отримаєте 43, 5 петабайта даних. Ми фізично не можемо це рухати. Таким чином, задумавши нас, нам доведеться виштовхувати аналітику в пристрій.

Але одна з речей, яка цікава, коли я дивлюся на всю цю архітектуру - і мені хочеться побачити, що ви думаєте з цього приводу - це ми рухалися до головного управління даними, начебто, до перших принципів управління даними, тягнучи все в центральне місце. У нас є озера даних, а потім ми створюємо невеликі ставки даних, якщо хочете, витяги з того, на що ми робимо аналітику, але, поширюючи до краю, одне з речей, яке постійно з'являється, особливо від людей із бази даних та менеджерів даних або люди, що займаються управлінням інформацією, що відбувається, коли у мене багато розповсюджених мініатюрних озер даних? Які речі були застосовані до цього мислення щодо кращої аналітики у вашому рішенні, тому що, традиційно, все було б централізовано з озером даних, тепер ми закінчуємо ці маленькі калюжі даних скрізь, і хоча ми можемо виконайте аналітику на місцях, щоб отримати деяке місцеве розуміння, які проблеми ви зіткнулися і як ви вирішили це, маючи цей розподілений набір даних, і особливо, коли ви отримуєте мікрокосми озер даних та розподілених ділянок?

Шон Роджерс: Ну, я думаю, це одна з проблем, правда? Коли ми відходимо від, ви знаєте, перевезення всіх даних назад до центру розташування або основного аналітичного прикладу, який я дав, а потім ми робимо розподілену версію, це те, що ви закінчите усі ці маленькі силоси, правда? Так само, як ви зобразили, правда? Вони роблять трохи роботи, працює якась аналітика, але як ви їх зближуєте? І я думаю, що ключовим моментом буде оркестрація у всьому цьому, і я думаю, що ви, хлопці, погодиться зі мною, але я щасливий, якщо ви цього не зробите, я думаю, що ми спостерігали цю еволюцію досить деякий час.

Повертаючись до часів наших друзів містера Інмона та містера Кімбола, які допомагали всім в архітектурі їхніх ранніх інвестицій у сховища даних, справа в тому, що ми давно пішли від цієї централізованої моделі. Ми прийняли цю нову ідею, щоб дозволити даних продемонструвати свою серйозність там, де вона найкраще повинна перебувати всередині вашої екосистеми, і вирівняти дані з найкращою можливою платформою для найкращого можливого результату. І ми почали проводити, на мій погляд, більш організований підхід до нашої екосистеми як всеохоплюючий спосіб робити речі, тому що ми намагаємося вирівняти всі ці частини одразу. Який тип аналітики чи роботи я збираюся робити з даними, який тип даних це, це допоможе продиктувати, де вони повинні жити. Де він виробляється і який тип сили тяжіння мають дані?

Ви знаєте, ми бачимо багато таких прикладів великих даних, коли люди говорять про те, що мають 10- та 15-петабайтні озера. Добре, якщо у вас є озеро даних, яке є таким великим, вам дуже недоцільно переміщувати його, і тому ви повинні мати можливість довести аналітику до нього. Але коли ви це робите, до основи вашого питання, я думаю, що це викликає багато нових викликів для кожного, щоб організувати навколишнє середовище та застосувати управління та безпеку, і зрозуміти, що потрібно зробити з цими даними, щоб вилікувати їх і отримуйте з нього найвищу цінність. І якщо чесно з вами - я хотів би почути вашу думку тут - я думаю, що ми там ранні дні, і я думаю, що ще належить зробити багато хорошої роботи. Я думаю, такі програми, як Statistica, зосереджуються на наданні більшої кількості людей доступу до даних. Ми, безумовно, зосереджені на таких нових персонажах, як науковець із даних про громадян, які хочуть загнати прогностичну аналітику до місць організації, яких раніше не було. І я думаю, що це деякі з перших днів цього, але я думаю, що дуга зрілості повинна демонструвати високий рівень або оркестрованість та вирівнювання між цими платформами, і розуміння того, що на них і чому. І це вікова проблема для всіх нас.

Дез Бланчфілд: Дійсно, це так, і я з вами повністю погоджуюсь з цим, і я думаю, що чудова річ, яку ми сьогодні чуємо тут, - це, принаймні, передній кінець проблеми фактичного фіксації даних на, мабуть, рівні шлюзу на межі мережі та можливості робити аналітику в цей момент по суті вирішені зараз. І тепер це звільняє нас від того, щоб насправді почати думати про наступне завдання, яке розповсюджується озерами даних. Дуже дякую за це, це була фантастична презентація. Я дуже вдячний за можливість поговорити з вами про це.

Я зараз перейду до Робіна, тому що знаю, що він має, і тоді Ребекка також отримала довгий список чудових питань від глядачів після Робіна. Робін?

Доктор Робін Блор: Гаразд. Шон, я хотів би сказати трохи більше, і я не намагаюся дати тобі можливість рекламувати це, але насправді це дуже важливо. Мені цікаво дізнатися, в який момент Statistica фактично створила можливість експорту моделі. Але я також хотів би, щоб ти сказав щось про Boomi, тому що все, що ти казав поки що про Boomi, це те, що це ETL, і це справді ETL. Але насправді це цілком здатний ETL, і для того, про який час ми говоримо, і деякі ситуації, про які ми тут обговорюємо, це дуже важлива річ. Не могли б ви поговорити з цими двома речами для мене?

Шон Роджерс: Звичайно, так, я абсолютно можу. Ви знаєте, наш рух у цьому напрямку, безумовно, був ітеративним, і це був свого роду покроковий процес. Ми тільки готуємось цього тижня, щоб запустити Версію 13.2 Statistica. У ньому є новітні оновлення всіх можливостей, про які ми сьогодні говоримо. Але повертаючись до версії 13, рік тому в жовтні, ми оголосили про можливість експортувати моделі з нашої платформи, і тоді ми назвали це NDAA. Абревіатура означала Native Distributed Architecture Architecture. Ми зробили багато часу, енергії та зосередження уваги на відкритті нашої платформи з можливістю використовувати її як центральний командний центр для вашої передової аналітики, а також розгортати звідти. І перші місця, Робін, які ми розгорнули, ми зробили дійсно, дійсно чудове доповнення до платформи навколо машинного навчання. І тому ми мали можливість розгортатися від Statistica до Azure Cloud Microsoft, щоб використовувати потужність Azure для силового машинного навчання, як відомо, дуже інтенсивно, і це прекрасний спосіб використовувати хмарні технології. І так це було першим шматочком.

Тепер ми експортували наші моделі в Azure і використовували Azure для їх запуску, а потім відправляли дані або результати назад на платформу Statistica. А потім ми перейшли до інших мов, з яких ми хотіли експортувати, і, звичайно, одна з них, як Java, відкриває нам двері, щоб зараз почати експортувати наші моделі назовні в інші місця на зразок Hadoop, тож це дало нам теж виставу.

І нарешті, ми зосередилися на можливості вивести наші моделі з цим випуском у бази даних. І так це було першою ітерацією, і, якщо чесно з вами, кінцева гра була IoT, але ми ще не були з версією 13 минулого жовтня. Відтоді ми потрапили туди, і це пов'язане з можливістю робити все те, про що я вже згадував, але потім мати якесь транспортне пристрій. І повернувшись до питання Деза про те, що ви знаєте, у чому полягає проблема і як ми це робимо, коли у нас є вся ця аналітика? Ми використовуємо Boomi як центр дистрибуції, і тому, що він знаходиться у хмарі і тому, що він настільки потужний, як я вже згадував, це платформа інтеграції даних, але це також платформа інтеграції додатків, і вона використовує JVM, щоб дозволити нам щоб припаркуватись і виконувати роботу в будь-якому місці, де можна висадити віртуальну машину Java. Ось що насправді відкрило двері для всіх цих шлюзів та крайових обчислювальних платформ та крайових серверів, тому що всі вони мають обчислення та платформу, доступну для запуску JVM. І тому, що ми можемо запускати JVM в будь-якому місці, Boomi звернувся щоб бути чудовим розповсюдженням і, використовуючи моє слово раніше, пристрій оркестрації.

І це стає дуже важливим, тому що ми всі, знаєте, я думаю, що сценарій літака хвилину тому був чудовим, і я згадав, знаєте, виробників, як Shire, які мають десять тисяч датчиків на одному зі своїх заводів, ви доведеться почати вирішувати такий собі центральний підхід до передової аналітики в якийсь момент. Бути ad hoc з цього приводу вже не працює. Раніше це було, коли обсяг моделей та алгоритмів, які ми працювали, був мінімальним, але зараз він максимум. В організації їх тисячі. Отже, у нас є частина нашої платформи, заснована на сервері, і коли у вас є наше програмне забезпечення для підприємства, ви також маєте можливість налаштувати та оцінювати свої моделі та керувати ними в різних середовищах. І це теж частина тієї оркестрової речі. Нам потрібно було мати шар, Робін, на місці, який не тільки дозволив вам отримати модель там, в першу чергу, але і дав вам дорогу для налаштування моделей та їх заміни на постійній основі так часто, як вам потрібно, тому що це не те, що можна зробити вручну. Ви не можете ходити навколо нафтопереробного заводу з великим пальцем, намагаючись завантажити моделі на шлюзи. Ви повинні мати систему транспортування та управління між ними, і тому поєднання Statistica і Boomi дає це нашим клієнтам.

Доктор Робін Блер: Так. Я дуже короткий, але, ви знаєте, це твердження, яке було зроблено раніше про озеро даних та ідею накопичення петабайт у будь-якому місці та про те, що воно має гравітацію. Ви знаєте, коли ви почали говорити про оркестрацію, це просто почало замислюватись над дуже простим фактом, що, знаєте, розміщення озера даних, яке є дуже великим, в одному місці, ймовірно, означає, що вам потрібно створити резервну копію, і це, мабуть, означає, що вам доведеться переміщувати багато даних навколо. Ви знаєте, справжня архітектура даних набагато більше, на мою думку, все одно, набагато більше в тому напрямку, про який ви говорите. Який би я сказав, що це розподілити його на розважливі місця. І схоже, у вас є дуже хороші можливості для цього. Я маю на увазі, що я добре ознайомлений з Boomi, тому це, так чи інакше, майже несправедливо, що я це бачу, і, можливо, публіка не може. Але, на мій погляд, Boomi настільки важливий, що стосується того, що ви робите, оскільки він має можливості застосування. А також тому, що правда в тому, що ви не робите цих аналітичних розрахунків, не бажаючи робити щось десь з тих чи інших причин. І Бумі відіграє певну роль у цьому, правда?

Шон Роджерс: Так, абсолютно. І так, як ви знаєте з попередніх розмов, Statistica має повноцінний механізм ділових правил. І я думаю, що це дійсно важливо, коли ми переходимо до того, чому це робимо. Ви знаєте, я жартував наперед, що насправді немає причин робити IoT взагалі, якщо ви не збираєтеся аналізувати, використовувати дані для прийняття кращих рішень чи вжиття заходів. І тому те, на чому ми зосередили увагу, було не просто в змозі поставити модель там, а можливість тегувати разом із нею, набір правил. А оскільки Boomi настільки міцний у своїх можливостях переміщувати речі з одного місця на інше, в атомі Boomi ми можемо також вбудувати здатність спрацьовувати, оповіщати та вживати заходів.

І ось тут ми починаємо отримувати такий витончений вигляд даних IoT, де ми говоримо: «Гаразд, ці дані варто слухати». Але насправді, ви знаєте, знаючи, що «світло горить, світло горить, світло увімкнено, світло увімкнено »не так цікаво, як коли світло згасає, або коли детектор диму згасає, або коли все, що відбувається з нашим виробничим процесом, виходить із спекуляції. Коли це відбувається, ми хочемо негайно вжити заходів. І дані стають тут майже другорядними. Тому що не так важливо, що ми зберегли всі ці "добре, добре, добре", важливо, що ми помітили "Ей, це погано", і ми негайно вжили заходів. Незалежно від того, чи є це повідомлення комусь із електронних листів чи ми можемо залучити доменну експертизу, чи ми розпочали чи не ряд інших процесів негайно вжити заходів, будь то коригуючі чи у відповідь на інформацію. І я думаю, що саме тому ви повинні мати цей оркестрований погляд на це. Ви не можете просто зосередитися на роботі над своїми алгоритмами. Ви повинні вміти їх координувати та оркеструвати. Ви повинні мати можливість бачити, як вони працюють. І справді, найголовніше, я маю на увазі, чому б чорт ти це зробив, якщо ти не можеш додати можливості негайно вжити заходів щодо даних?

Доктор Робін Блор: Гаразд, Ребекка, я вважаю, у вас є питання у аудиторії?

Ребекка Йозвяк: Я. У мене є багато питань аудиторії. Шон, я знаю, що ти не хотів занадто довго зависати на вершині години. Що ти думаєш?

Шон Роджерс: Я задоволений. Іди вперед. Я можу відповісти на кілька.

Ребекка Йозвяк: Побачимо. Я знаю, що ви згадали одне з речей, що IoT є в перші дні, і він має ступінь зрілості, який повинен мати місце, і це наче розмовляє з цим питанням один із учасників. Якщо рамка IPv6 буде достатньо надійною, щоб забезпечити зростання IoT в наступні п'ять-десять років?

Шон Роджерс: О, я хочу дозволити Дезі відлунюватися від моєї відповіді, тому що я думаю, що він ближче до такого типу інформації, який я є. Але я завжди думав, що ми дуже швидко рухаємося, щоб зігнути і зламати більшість рам, які у нас є. І хоча я думаю, що додавання цієї нової специфікації або напрямок, з яким ми рухаємось з рамками IPv6, є важливим, і це відкриває нам двері, щоб мати набагато більше пристроїв і мати можливість дати все, що ми хочете дати адресу. Я думаю, що все, що я читаю і бачу зі своїми клієнтами, і кількість необхідних адрес, я думаю, в якийсь момент це призведе до іншого зміни в цьому ландшафті. Але я насправді не експерт з мереж, тому не можу на сто відсотків сказати, що ми збираємось його порушити в якийсь момент. Але мій досвід говорить про те, що ми в якийсь момент порушимо цю модель.

Ребекка Йозв'як: Я не здивуюсь. Я думаю, що рамки - це своєрідне прорив під вагою всіляких речей. І це просто логічно, правда? Тобто, ви не можете надсилати електронний лист із машинкою. Інший учасник запитує: "Чи можете ви використовувати рамку Hadoop?", Але, мабуть, я можу змінити це, щоб сказати, як би ви використовували структуру Hadoop для розподіленої аналітики?

Шон Роджерс: Ну, Робін зробив мені прихильність задати мені історичне запитання, і тому, починаючи з версії 13 приблизно рік тому для Statistica, ми мали можливість вигнати моделі з нашої системи і в Hadoop. І ми дуже тісно співпрацюємо з усіма великими ароматами Hadoop. У нас справді великі історії успіху навколо можливості роботи з Cloudera як однієї з основних дистрибуцій Hadoop, з якою ми працюємо. Але оскільки ми можемо виводити на Java, це дає нам можливість бути відкритими та розміщувати нашу аналітику в будь-якому місці. Розміщення їх у кластері Hadoop - це те, що ми робимо на звичайній і регулярній та щоденній основі для багатьох наших клієнтів. Коротка відповідь - так, абсолютно.

Ребекка Йозвяк: Відмінно. А я просто кину на тебе ще одного і дам тобі продовжити свою відпустку. Інший учасник запитує, за допомогою аналітики IoT та машинного навчання, чи вважаєте ви, що всі дані потрібно зберігати для історичних цілей і як це вплине на архітектуру рішення?

Шон Роджерс: Ну, я не думаю, що всі дані повинні зберігатися. Але я думаю, що дуже цікаво мати можливість розважати, слухати будь-яке джерело даних, яке ми хочемо в нашій організації, звідки б це не було. І я думаю, що зміни, які ми спостерігали на ринку протягом останніх кількох років, дали нам змогу застосувати цей підхід до даних, і це, здається, справді окупилося. Але це буде різним для кожної компанії та кожного випадку використання. Ви знаєте, коли ми дивимося на дані про стан здоров'я, зараз існує багато регуляторних питань, багато питань, щодо яких потрібно дотримуватися, і це змушує нас зберігати дані, які інші компанії можуть не розуміти, чому це потрібно зберігати, правда ? У виробничих процесах для багатьох наших виробничих замовників існує справжній перелом, щоб можна було історично досліджувати ваші процеси та мати можливість оглянути великі обсяги цих даних, щоб дізнатися з них та створити з них кращі моделі.

Я думаю, що багато даних потрібно буде зберігати, і я думаю, що у нас є рішення, які роблять це більш економічним і масштабованим сьогодні. Але в той же час я думаю, що кожна компанія знайде значення в даних, які їм не потрібно зберігати на атомному рівні, але вони захочуть аналізувати в режимі реального часу та приймати рішення щодо того, щоб стимулювати інновації в межах їхня компанія.

Ребекка Йозвяк: Добре добре. Ні, аудиторія, я сьогодні не потрапляв на всі питання, але я перешлю їх Шону, щоб він міг зв’язатися з вами безпосередньо та відповісти на ці запитання. Але дякую всім за відвідування Велике спасибі Шоуну Роджерсу від Dell Statistica та всім нашим аналітикам, Дезу Бланчфілду та доктору Робіну Блору. Ви можете знайти архів тут, на веб-сайті insideanalysis.com, SlideShare, ми знову почали складати свої речі туди, і ми реконструюємо наш YouTube, тому шукайте і його. Дякую так багато людей. І з цим я попрощаюсь, і ми побачимось наступного разу.

Аналіз краю: економіка йоту нарешті