Najlepsze określone plany: oszczędność czasu, pieniędzy i kłopotów dzięki optymalnym prognozom

Na wynos: Prowadzący Eric Kavanagh omawia prognozowanie z dr Robin Bloor, Rickiem Shermanem i IDERA Bullett Manale.

Musisz zarejestrować się na to wydarzenie, aby obejrzeć wideo. Zarejestruj się, aby zobaczyć wideo.

Eric Kavanagh: Panie i panowie! Witajcie jeszcze raz i witajcie ponownie w serii webcastów Hot Technologies! Nazywam się Eric Kavanagh, będę gospodarzem dzisiejszego seminarium internetowego, zatytułowanego „Oszczędzanie czasu, pieniędzy i kłopotów dzięki optymalnym prognozom”. Oczywiście brakowało mi tam pierwszej części tytułu „Najlepsze rozłożone plany”. Zawsze rozmawiamy o tym w tym programie. Tak więc Hot Technologies jest oczywiście naszym forum do zrozumienia, jakie są niektóre fajne produkty na świecie, świat technologii dla przedsiębiorstw, co ludzie robią z nimi, jak działają, i tego rodzaju zabawne rzeczy.

A dzisiejszy temat, jak sugeruję, dotyczy prognozowania. Naprawdę próbujesz zrozumieć, co się wydarzy w Twojej organizacji. Jak zamierzasz dbać o zadowolenie użytkowników bez względu na to, co robią? Jeśli przeprowadzają analizy, jeśli wykonują prawdziwą pracę, stoją w obliczu prawdziwych klientów z systemami transakcyjnymi, bez względu na przypadek, chcesz zrozumieć, jak działają twoje systemy i co się dzieje, i o tym dobrze dzisiaj mówić. To trochę zabawne, ponieważ prognozowanie nie jest czymś, co lubię robić, bo jestem przesądny, tak jak myślę, że jeśli przepowiednię za dużo, zdarzają się złe rzeczy, ale to tylko ja. Nie podążaj za mną.

Oto nasi prezenterzy dzisiaj, naprawdę w lewym górnym rogu, Rick Sherman dzwoni z Bostonu, nasz kumpel Bullett Manale z IDERA i nasz własny doktor Robin Bloor. I po tym, przekażę to Robinowi i po prostu przypomnijcie ludziom: zadawaj pytania, nie wstydź się, uwielbiamy dobre pytania, dobrze przedstaw je dzisiaj naszym prezenterom i innym. I z tym, Robin, zabierz to.

Robin Bloor: OK, cóż, ponieważ jestem na pierwszym miejscu, jak mówią, myślałem, że opowiem dziś historię SQL, ponieważ jest to tło dla tego, o czym będzie kontynuowana dyskusja i nieuchronnie się nie koliduje, ponieważ Rick nie skupia się na tym i nie będzie kolidować z tym, co ma do powiedzenia Rick. Historia SQL zawiera kilka interesujących rzeczy na temat SQL, ponieważ jest tak dominujący. Zobacz, to jest literówka, SQL jest językiem deklaratywnym. Pomysł polegał na tym, że możesz stworzyć język, w którym prosisz o to, czego chcesz. Baza danych mogłaby się dowiedzieć, jak ją zdobyć. Właściwie to zadziałało całkiem dobrze, ale jest wiele rzeczy, o których warto powiedzieć, konsekwencje oparcia całej branży IT na deklaratywnym języku. Użytkownik nie zna ani nie dba o fizyczną organizację danych, i to jest dobra zaleta w języku deklaratywnym - oddziela cię od tego wszystkiego, a nawet martwi się o to - po prostu zapytaj o co chcesz, i bazę danych pójdę i wezmę to.

Ale użytkownik nie ma pojęcia, czy sposób, w jaki skonstruuje zapytanie SQL, wpłynie na jego wydajność, co jest nieco wadą. Widziałem zapytania o długości setek i setek linii, które są tylko jednym żądaniem SQL, wiesz, zaczyna się od „select” i po prostu kontynuuje od pod-zapytań i tak dalej. I faktycznie okazuje się, że jeśli chcesz konkretnej kolekcji danych z bazy danych, możesz poprosić o nią na wiele różnych sposobów za pomocą SQL i uzyskać tę samą odpowiedź, jeśli masz trochę znajomości danych. Tak więc jedno zapytanie SQL niekoniecznie jest najlepszym sposobem na zapytanie o dane, a bazy danych będą reagować zupełnie inaczej w zależności od wprowadzonego SQL.

I tak, SQL faktycznie wpływa na wydajność, więc ludzie, którzy używają SQL, to prawda dla nich, to również prawda dla programistów SQL, którzy używają SQL i jeszcze mniej są skłonni myśleć o wpływie, jaki będą mieli, ponieważ większość ich uwagi polega na manipulowaniu danymi, a nie na uzyskiwaniu, wprowadzaniu danych. To samo dotyczy narzędzi BI, widziałem SQL, który, jeśli chcesz, wyciska się z narzędzi BI różnych baz danych i trzeba powiedzieć, że wiele z nich to, no cóż, nie pisałbym zapytań SQL tak. Jego ktoś stworzył, jeśli chcesz, mały silnik, który bez względu na parametry, wyrzuci trochę SQL, i znowu, ten SQL niekoniecznie będzie wydajnym SQL.

Potem pomyślałem, że wspomnę o niedopasowaniu impedancji, dane używane przez programistów różnią się od danych podczas sortowania. Tak więc nasz DMS przechowuje dane w tabelach, kod zorientowany obiektowo to w większości kodery, programujemy obecnie obiektowo i porządkują dane w strukturach obiektowych, więc nie mapuje się między nimi. Istnieje więc potrzeba przetłumaczenia z tego, co programista uważa za dane, na to, co baza danych uważa za dane. Wydaje się, że musieliśmy zrobić coś złego, aby tak się stało. SQL ma DDL do definicji danych, ma DML - język manipulacji danymi - wybierz, projektuj i dołącz, aby uzyskać te dane. Teraz jest bardzo mało matematyki i bardzo mało rzeczy opartych na czasie, więc jest to niedoskonały język, chociaż trzeba powiedzieć, że został przedłużony i nadal jest rozszerzany.

I wtedy pojawia się problem z barierą SQL, który jest zawsze prostszy niż schemat, ale wiele osób zadawało pytania z powodów analitycznych, gdy tylko otrzymali odpowiedź na warunki danych pytania, chcą zadać inne pytanie. Staje się więc rzeczą dialogową, no cóż, SQL nie został zbudowany dla okien dialogowych, został zbudowany po to, by pytać o to, czego chcesz od razu. Warto to wiedzieć, ponieważ istnieją pewne produkty, które faktycznie rezygnują z SQL, aby umożliwić konwersację między użytkownikiem a danymi.

Jeśli chodzi o wydajność bazy danych - i ten rodzaj rozprzestrzenia się na wszystko - tak, tam jest procesor, pamięć, dysk, obciążenie sieci i problem blokowania więcej niż jednej osoby, która chce mieć wyłączne wykorzystanie danych w danym momencie punkt w czasie. Ale są też słabe wywołania SQL, jest okropnie dużo, co można zrobić, jeśli faktycznie zoptymalizujesz SQL pod względem wydajności. Tak więc czynniki wydajności bazy danych: zły projekt, zły projekt programu, brak współbieżności obciążenia, równoważenie obciążenia, struktura zapytań, planowanie wydajności. To jest wzrost danych. W kilku słowach SQL jest wygodny, ale nie sam się optymalizuje.

Powiedziawszy to, myślę, że możemy przekazać Rickowi.

Eric Kavanagh: W porządku, Rick, dam ci klucze do samochodu WebEx. Zabierz to.

Rick Sherman: W porządku, świetnie. Cóż, dzięki Robin, kiedy zaczęliśmy na początku prezentacji, moja grafika jest wciąż dość nudna, ale idź z tym. Zgadzam się ze wszystkim, o czym mówiła Robin po stronie SQL. Ale teraz chcę się trochę skoncentrować na popycie na dane, które bardzo szybko przechodzą, podaż jak w narzędziach używanych w tej przestrzeni lub potrzeba narzędzi w tej przestrzeni.

Po pierwsze, w każdym czytanym artykule jest coś z dużymi danymi, dużą ilością danych, nieuporządkowanymi danymi pochodzącymi z chmury, dużymi danymi wszędzie, co można sobie wyobrazić. Ale wzrost rynku baz danych stale rośnie dzięki SQL, relacyjnej bazie danych prawdopodobnie od 2015 r., Nadal stanowi 95 procent rynku baz danych. Trzej najlepsi dostawcy relacyjni mają około 88 procent udziału w rynku w tej przestrzeni. Tak więc, jak mówił Robin, wciąż rozmawiali o SQL. W rzeczywistości, nawet patrząc na platformę Hadoop, Hive i Spark SQL - z których mój syn, który jest naukowcem danych, korzysta obecnie cały czas - jest z pewnością dominującym sposobem na dostęp do danych.

Teraz, po stronie bazy danych, istnieją dwie szerokie kategorie wykorzystania baz danych. Jeden dotyczy operacyjnych systemów zarządzania bazami danych, a więc planowania relacji korporacyjnych, zarządzania relacjami z klientami, systemów ERP Salesforce, Oracle, EPIC, N4 itp. Na całym świecie. I jest ich ogromna ilość, a liczba ta rośnie w hurtowniach danych i innych systemach opartych na analizie biznesowej. Ponieważ wszystko, niezależnie od tego, gdzie i jak jest przechwytywane, przechowywane lub przeprowadzane, ostatecznie jest analizowane, a więc istnieje ogromne zapotrzebowanie i wzrost wykorzystania baz danych, szczególnie relacyjnych baz danych na rynku.

Teraz mamy zapotrzebowanie, nadchodzą ogromne ilości danych. I tak naprawdę nie mówię tylko o dużych danych, mówię o wykorzystaniu danych we wszelkiego rodzaju przedsiębiorstwach. Ale towarzysząc temu od strony podaży, dla ludzi, którzy mogą zarządzać tymi zasobami, najpierw zaczynamy, mamy coś w rodzaju niedoboru DBA. Według Bureau of Labor Statistics, w latach 2014–2024 liczba miejsc pracy w DBA wzrośnie tylko o 11 procent - teraz to ludzie, którzy mają tytuły pracy w DBA, ale dobrze o tym mówić w ciągu sekundy - w porównaniu do ponad 40 procent roczna przestrzeń wzrostu danych. I mamy dużo DBA; średnio to samo badanie mówiące o średnim wieku jest dość wysokie w porównaniu do innych zawodów IT. A potem mamy wielu ludzi opuszczających boisko, niekoniecznie przechodzących na emeryturę, ale przechodzących na inne aspekty, zajmujących się zarządzaniem lub cokolwiek innego.

Jednym z powodów, dla których odchodzą, jest to, że zadanie DBA staje się coraz trudniejsze. Po pierwsze, mamy DBA zarządzających wieloma różnymi bazami danych, fizycznymi bazami danych, rozmieszczonymi w każdym miejscu, a także różnymi typami baz danych. Teraz mogą być relacyjne lub mogą to być również inne typy baz danych. Ale nawet jeśli jest to relacyjne, mogliby mieć jednego, dwóch, trzech, czterech różnych dostawców, którymi tak naprawdę chcą zarządzać. DBA zazwyczaj angażują się po zaprojektowaniu bazy danych lub aplikacji. Robin mówił o projektowaniu baz danych lub aplikacji oraz o projektowaniu SQL. Cóż, kiedy mówiono o modelowaniu danych, modelowaniu ER, rozszerzonym modelowaniu ER, modelowaniu wymiarów, zaawansowanym modelowaniu wymiarowym, cokolwiek, zwykle programiści aplikacji i deweloperzy aplikacji projektują z myślą o swoim ostatecznym celu - nie projektują pod kątem wydajności samej struktury bazy danych . Mamy więc dużo złego projektu.

Teraz nie mówię o sprzedawcach komercyjnych aplikacji biznesowych; zazwyczaj mają modele ER lub rozszerzone modele ER. Mówię o tym, że w każdej firmie deweloperzy aplikacji budują o wiele więcej procesów biznesowych i aplikacji - te niekoniecznie są zaprojektowane pod kątem wydajności lub skuteczności wdrażania. A same DBA są przepracowane i czasami ponoszą odpowiedzialność 24/7, ciągle zdobywają coraz więcej baz danych. Myślę, że ma to trochę wspólnego z tym, że ludzie nie do końca rozumieją, co robią lub jak to robią. Ich własna mała grupa i ludzie po prostu myślą: „Cóż, wszystkie te narzędzia są tak łatwe w użyciu, że możemy po prostu rzucać coraz więcej baz danych na ich obciążenie”, co nie jest prawdą.

Co prowadzi nas do pracy w niepełnym wymiarze godzin i przypadkowych DBA. Mamy małe zespoły IT i niekoniecznie stać ich na dedykowane DBA. Tak jest teraz w przypadku małych i średnich firm, w których ekspansja bazy danych i aplikacji bazodanowych eksplodowała w ciągu ostatniej dekady i nadal się rozwija. Dotyczy to również dużych korporacji, które zajmują się hurtownią danych, analizami analityki biznesowej od bardzo długiego czasu. Dawno temu otrzymywaliśmy dedykowane DBA dla tych projektów; nigdy nie otrzymujemy dedykowanego DBA. Byliśmy odpowiedzialni za zaprojektowanie bazy danych, co jest w porządku, jeśli jest to ktoś, kto ma doświadczenie.Ale ogólnie rzecz biorąc, DBA są programistami aplikacji, często przyjmują tę rolę jako część swojej pracy w niepełnym wymiarze godzin, nie mają formalnego szkolenia w tym zakresie i ponownie, projektują ją dla swoich celów końcowych, nie projektują jej pod kątem wydajności.

I istnieje duża różnica między projektowaniem i rozwojem, a wdrażaniem i zarządzaniem. Mamy więc „mądrego grosza, głupiego funta” z małą skarbonką, która pomija zdobywanie umiejętności i zasobów potrzebnych w projektach. Myśląc, że wszyscy pochodzą z „Zemsty frajerów”, mój mały obrazek tam. Teraz, o ile ludzie tego potrzebują, mamy coraz większe wykorzystanie baz danych i danych w SQL. Mamy ograniczoną liczbę DBA - ludzi, którzy są wykwalifikowani i ekspertami w tych sytuacjach dostrajania i projektowania oraz zarządzania i wdrażania. Coraz częściej mamy do czynienia z przypadkowymi lub przypadkowymi DBA, ludźmi, którzy nie mieli formalnego szkolenia.

Więc jakie są inne rzeczy, które dotyczą również faktu, że te bazy danych nie są dostrajane, ani też zarządzane? Po pierwsze, wiele osób zakłada, że sam system bazy danych ma wystarczające narzędzia do samodzielnego zarządzania. Teraz narzędzia stają się coraz łatwiejsze - projektowanie i rozwój - ale to coś innego niż robienie dobrego projektu i dobrego zarządzania, planowania wydajności, monitorowania itp. W celu wdrożenia. Po pierwsze, ludzie zakładają, że mają wszystkie potrzebne narzędzia. Po drugie, jeśli jesteś niepełnoetatowym lub przypadkowym DBA, nie wiesz, czego nie wiesz.

Wydaje mi się, że zapomniałem o niektórych frazach, dlatego często nie rozumieją, na co muszą patrzeć w projekcie lub kiedy zarządzają bazami danych lub nimi zarządzają. Jeśli to nie jest twój zawód, to nie zrozumiesz, co musisz zrobić. Po trzecie, SQL jest narzędziem typu „go-to”, więc Robin mówił o SQL i o tym, jak słabo skonstruowany jest SQL. A także jednym z moich domowych pomysłów w zakresie hurtowni danych BI, migracji danych, przestrzeni inżynierii danych jest to, że zamiast używać narzędzi, ludzie mają tendencję do pisania kodu SQL, procedur przechowywanych, nawet jeśli używają drogiego narzędzia do integracji danych lub drogiego Narzędzie BI, często naprawdę używają go tylko do uruchamiania procedur przechowywanych. Dlatego coraz ważniejsze staje się zrozumienie projektowania baz danych, konstrukcji SQL.

I wreszcie jest to podejście silosowe, w którym indywidualni ludzie patrzą na poszczególne bazy danych. Nie patrzą na działanie aplikacji i interakcje między nimi. I tak naprawdę często patrzą na bazy danych w porównaniu do aplikacji, w których ich używają. Tak więc obciążenie pracą bazy danych jest krytyczne przy projektowaniu, krytyczne przy jego dostrajaniu, krytyczne przy próbach wymyślenia, jak zaplanować pojemność itp. Tak więc patrząc na las z drzew, ludzie są w chwastach , patrząc na poszczególne tabele i bazy danych i nie patrząc na ogólną interakcję tych aplikacji w obciążeniu.

Wreszcie ludzie muszą spojrzeć na kluczowe obszary, na które powinni spojrzeć. Kiedy planują zarządzać bazami danych, muszą najpierw pomyśleć o, opracować pewne mierniki wydajności zorientowane na aplikacje, więc muszą przyjrzeć się nie tylko strukturze tabeli, jej modelowaniu, ale w jaki sposób jest ona wykorzystywana? Tak więc, jeśli masz aplikację korporacyjną wymaganą do zarządzania łańcuchem dostaw, jeśli odbierasz zamówienia z sieci, jeśli wykonujesz BI - cokolwiek robisz - musisz spojrzeć na to, kto z nich korzysta, jak go używa, jakie są wielkości danych , kiedy to się stanie. To, czego tak naprawdę szukasz, to czasy oczekiwania, ponieważ bez względu na wszystko, wszystkie aplikacje są oceniane na podstawie tego, ile czasu zajmuje wykonanie zadania, niezależnie od tego, czy jest to osoba, czy tylko wymiana danych między aplikacjami lub procesorami. A jakie są wąskie gardła? Tak często, gdy próbujesz debugować problemy, naprawdę próbujesz spojrzeć na to, jakie są prawdziwe wąskie gardła - niekoniecznie jak dostroić wszystko, ale jak pozbyć się i podnieść wydajność, zwiększając czas oczekiwania i przepustowość - cokolwiek musisz na to spojrzeć.

Naprawdę musisz oddzielić przechwytywanie danych, transakcje, aspekty transformacji w bazie danych wraz z analizami. Każdy z nich ma inne wzorce projektowe, każdy z nich ma inne wzorce użytkowania i każdy z nich musi być dostrojony inaczej. Musisz więc pomyśleć o tym, jak te dane są wykorzystywane, kiedy są wykorzystywane, do czego są używane, i dowiedzieć się, jakie wskaźniki wydajności i jakie są kluczowe rzeczy, które chcesz analizować związane z tym użyciem. Teraz, gdy patrzysz na monitorowanie wydajności, chcesz przyjrzeć się samym operacjom bazy danych; chcesz przyjrzeć się obu strukturom danych, więc indeksy, partycjonowanie i inne fizyczne aspekty bazy danych, a nawet strukturę bazy danych - czy to model ER, czy model wymiarowy, ale struktura - wszystko to ma wpływ na wydajność , szczególnie w różnych wadach analizy danych i przeprowadzanych transformacjach.

I jak wspomniano Robin po stronie SQL, przyjrzenie się kodowi SQL uruchamianemu przez te różne aplikacje w tych bazach danych i dostrojenie go jest kluczowe. I patrząc na ogólne obciążenia aplikacji oraz środowisko infrastruktury, w którym działają te bazy danych i aplikacje. Tak więc, że sieci, serwery, chmura - bez względu na to, na czym działają - również patrząc na wpływ, jaki te aplikacje i te bazy danych wywierają w ramach tego oszustwa, wszystkie one mogą współdziałać z możliwością dostrojenia bazy danych.

I wreszcie, gdy patrzysz na narzędzia, chcesz mieć możliwość spojrzenia na trzy różne rodzaje analiz z tym związanych. Chcesz spojrzeć na analizę opisową: co się dzieje i gdzie, związane z bazą danych i wydajnością aplikacji. Chcesz mieć możliwość przeprowadzania analiz diagnostycznych, aby dowiedzieć się nie tylko, co się dzieje, ale dlaczego tak się dzieje, gdzie są wąskie gardła, gdzie są problemy, co działa dobrze, a co nie działa dobrze? Ale możliwość analizowania i drążenia w obszarach problemowych w celu rozwiązania tych problemów, zarówno w zakresie projektowania, jak i tego, co musisz zrobić.

Wreszcie najbardziej agresywnym lub proaktywnym typem analizy jest przeprowadzenie analizy predykcyjnej, modelowanie analizy predykcyjnej, cokolwiek. Wiemy, że baza danych i aplikacje działają w ten sposób, jeśli zwiększymy pojemność, jeśli zdobędziemy więcej użytkowników, jeśli zwiększymy przepustowość, cokolwiek byśmy nie robili, będąc w stanie przewidzieć, co, jak i gdzie to wpłynie na bazę danych, aplikacje, pozwala nam planować i aktywnie się zastanawiać, gdzie są wąskie gardła, gdzie mogą cierpieć czasy oczekiwania i co musimy zrobić, aby to naprawić. Dlatego chcemy mieć narzędzia, które są w stanie zaimplementować wskaźniki wydajności, monitorować wydajność, podobnie jak te trzy rodzaje analiz. I to jest mój przegląd.

Eric Kavanagh: W porządku, pozwólcie, że przekażę to - nawiasem mówiąc, są to dwie świetne prezentacje - pozwólcie, że przekażę to Bullett Manale, aby ją stamtąd zabrała. I ludzie, nie zapomnijcie zadawać dobrych pytań; mamy już dobre treści. Zabierz to, Bullett.

Bullett Manale: Brzmi dobrze. Dzięki, Eric. Tak więc wiele z tego, co powiedział Rick i Robin, oczywiście zgadzam się ze 100 procentami. Powiedziałbym, że podciągnąłem ten slajd, bo myślę, że to pasuje, nie wiem dla tych z was, którzy są fanami „A-Teamu” w latach 80., John Hannibal Smith zawsze powtarzał: „Kocham gdy plan się zestawi ”. Myślę, że kiedy mówisz o SQL Serveru, na którym właśnie się koncentrujesz, to o produkcie, o którym mówimy dzisiaj, SQL Diagnostic Manager, to zdecydowanie jedna z tych rzeczy, które musisz mieć; musisz być w stanie wykorzystać posiadane dane i móc podejmować decyzje na podstawie tych danych, aw niektórych przypadkach nie szukasz decyzji; szukasz czegoś, co powie Ci, kiedy coś się skończy zasoby, kiedy zabraknie zasobów, kiedy będziesz miał wąskie gardło, tego typu rzeczy.

Nie chodzi tylko o monitorowanie konkretnej metryki. Tak więc, dzięki Menedżerowi diagnostyki, jedną z rzeczy, które robi bardzo dobrze, jest pomoc w zakresie prognozowania i zrozumienia specyficznych obciążeń, o których dzisiaj mówimy. Narzędzie jest dostosowane do menedżera danych, DBA lub działającego DBA, więc wiele rzeczy, o których wspomniał Rick, działające DBA jest tak prawdziwe. W wielu przypadkach, jeśli nie jesteś DBA, pojawi się wiele znaków zapytania, które będziesz mieć, jeśli chodzi o zarządzanie środowiskiem SQL, czego nie wiesz. Więc szukasz czegoś, co mogłoby ci pomóc, przeprowadzić cię przez ten proces, a także uczyć cię w tym procesie. Dlatego ważne jest, aby narzędzie, którego używasz do tego rodzaju decyzji, dało ci pewien wgląd w powody, dla których podejmowane są te decyzje, nie tylko mówi: „Hej, zrób to”.

Ponieważ jestem aktorką DBA, w końcu mogę stać się pełnoprawnym DBA z faktyczną wiedzą fachową i wiedzą na poparcie tego tytułu. To powiedziawszy, kiedy mówiłem o byciu administratorem bazy danych - zawsze najpierw pokazuję ten slajd, ponieważ DBA ma kilka różnych ról i zależnie od organizacji, w której jesteś, będziesz miał, że będą się różnić od z jednego miejsca do drugiego - ale zazwyczaj zawsze będziesz w jakiś sposób odpowiedzialny za swoje przechowywanie, planowanie tego przechowywania i zrozumienie przewidywania, powiem, ile miejsca będziesz potrzebować, czy to na kopie zapasowe, czy czy to dla samych baz danych. Musisz to zrozumieć i ocenić.

Ponadto będziesz musiał być w stanie zrozumieć i zoptymalizować rzeczy zgodnie z potrzebami, a przechodząc przez monitorowanie środowiska, oczywiście ważne jest, aby wprowadzać zmiany, gdy są potrzebne, w oparciu o rzeczy, które zmieniają się w środowisku samo. Podczas prognozowania należy wziąć pod uwagę liczbę użytkowników, popularność aplikacji, sezonowość bazy danych. A potem, oczywiście, patrząc na inne rzeczy pod względem możliwości dostarczania raportów i informacji niezbędnych w związku z podejmowaniem tych decyzji. W wielu przypadkach oznacza to przeprowadzenie analizy porównawczej; oznacza to zdolność do spojrzenia na konkretną metrykę i zrozumienia jej wartości w czasie, abyś mógł przewidzieć, w którym kierunku pójdzie naprzód.

Tak więc wiele narzędzi, które robi Menedżer diagnostyczny, ma te możliwości i ludzie używają go na co dzień, aby móc robić takie rzeczy, jak prognozowanie, i tutaj umieściłem tutaj definicję planowania wydajności. I jest to dość szeroka i właściwie dość niejasna definicja, która jest po prostu procesem określania zdolności produkcyjnej potrzebnej organizacji, aby sprostać zmieniającym się wymaganiom dotyczącym jej produktów, a na koniec o to właśnie chodzi: o tym, że możesz zbierać informacje, które masz w ten czy inny sposób, a także podejmować te informacje i podejmować decyzje, które pomogą ci iść naprzód w miarę postępów w cyklu życia baz danych. A zatem rodzaje rzeczy, które są powodem, dla których ludzie muszą to robić, to przede wszystkim, w większości przypadków, oszczędność pieniędzy. Firmy, oczywiście, ich głównym celem jest zarabianie pieniędzy i oszczędzanie pieniędzy. Ale wraz z tym oznacza to również możliwość upewnienia się, że przestoje nie występują. I będąc w stanie upewnić się, że zmniejszysz wszelkie szanse na przestój, więc powstrzymaj go od rozpoczęcia, innymi słowy, nie czekaj na to, a następnie zareaguj.

Oprócz możliwości ogólnego zwiększenia wydajności użytkowników, zwiększenie ich wydajności i zwiększenie wydajności biznesowej jest oczywiście kluczem tutaj, więc są to rodzaje rzeczy, które jako DBA lub ktoś zaangażowany w prognozowanie lub wydajność planowanie będzie musiało przebrnąć przez informacje, aby móc podejmować te decyzje. A potem, ogólnie rzecz biorąc, to oczywiście pomoże ci wyeliminować marnotrawstwo, nie tylko pod względem pieniędzy, ale także pod względem czasu i ogólnie po prostu zasobów, które mogłyby zostać wykorzystane na inne rzeczy. Tak więc, będąc w stanie wyeliminować te odpady, abyś nie ponosił kosztów alternatywnych związanych z samymi odpadami.

Tak więc, powiedziawszy to, jakie są rodzaje pytań, które otrzymujemy, specyficzne dla osoby, która jest DBA? Kiedy zabraknie mi miejsca? To duży, nie tylko ile zajmuję teraz, ale kiedy mam się skończyć, opierając się na trendach i historii z przeszłości? To samo z rzeczywistymi instancjami SQL, bazami danych, które serwery mogę konsolidować? Zamierzam umieścić trochę na maszynach wirtualnych, co ma sens pod względem tego, które bazy danych zamierzam skonsolidować i na których instancjach SQL powinny się znajdować? Należy odpowiedzieć na wszystkie tego rodzaju pytania. Ponieważ w większości przypadków, jeśli jesteś DBA lub działasz DBA, zamierzasz skonsolidować go w swojej karierze. W wielu przypadkach będziesz robił to na bieżąco. Musisz więc szybko podejmować te decyzje, a nie grać w zgadywanie.

Rozmawialiśmy o wąskich gardłach i tym, gdzie będą się one pojawiać, będąc w stanie przewidzieć to jeszcze raz, zamiast czekać na ich wystąpienie. Tak więc, oczywiście, o tych wszystkich rzeczach mówiono, mają sens w tym sensie, że polegają na danych historycznych, w większości przypadków, aby móc wygenerować te rekomendacje, lub w niektórych przypadkach samodzielnie sformułować decyzje, aby móc wymyślić te odpowiedzi. Ale przypomina mi o tym, że kiedy słyszysz reklamy radiowe dla kogoś, kto sprzedaje papiery wartościowe lub coś w tym rodzaju, jego zawsze „przeszłe wyniki nie wskazują na przyszłe wyniki” i tego rodzaju rzeczy. I to samo dotyczy tutaj. Będziesz mieć sytuacje, w których te prognozy i analizy mogą nie być w 100% prawidłowe. Ale jeśli masz do czynienia z rzeczami, które wydarzyły się w przeszłości i ze znanymi, i będąc w stanie brać i robić „co jeśli” z wieloma tego typu pytaniami, na które wpadniesz, jest bardzo cenny i będzie zabiorę cię o wiele dalej niż granie w zgadywanie.

Więc tego rodzaju pytania oczywiście pojawią się, więc jak radzimy sobie z wieloma z tych pytań za pomocą Diagnostic Manager, przede wszystkim mamy możliwości prognozowania, będąc w stanie to zrobić w bazie danych, w tabeli, a także w dysk lub wolumin. Aby móc nie tylko powiedzieć: „Hej, było dużo miejsca”, ale za sześć miesięcy, za dwa lata, za pięć lat, jeśli planuję na to, ile miejsca na dysku będę potrzebować do budżetu dla? To są pytania, które muszę zadać, i będę musiał umieć to zrobić, zamiast zgadywać i podnosić palec w powietrze i czekać, aby zobaczyć, w którą stronę wieje wiatr, co jest dużo czasami niestety sposób, w jaki podejmowanych jest wiele takich decyzji.

Poza tym, będąc w stanie - wygląda na to, że mój slajd został tam trochę odcięty - ale będąc w stanie zapewnić pomoc w formie zaleceń. Jedną rzeczą jest pokazanie pulpitu pełnego wskaźników i powiedzenie: „OK, oto wszystkie wskaźniki i gdzie one są”, ale potem możliwość zrobienia niektórych lub zrozumienia, zrobić, na tej podstawie to kolejny skok. W niektórych przypadkach ludzie są wystarczająco wykształceni w roli DBA, aby móc podejmować takie decyzje. Mamy więc w narzędziu pewne mechanizmy, które pomogą w tym, co dobrze pokaże w ciągu sekundy. Ale będąc w stanie pokazać nie tylko, co to jest rekomendacja, ale także dać wgląd w to, dlaczego ta rekomendacja jest tworzona, a ponadto, w niektórych przypadkach, być w stanie wymyślić skrypt, który automatyzuje rozwiązanie tego problemu jest również idealne.

Przechodząc do następnego tutaj, co dobrze widać, jego ogólnie mówiąc, zrozumienie do poziomu metrycznego, co jest normalne. Nie mogę ci powiedzieć, co nie jest normalne, jeśli nie wiem, co jest normalne. I tak, mając pewien sposób na zmierzenie tego, co jest kluczowe, musicie być w stanie wziąć pod uwagę wiele rodzajów obszarów, na przykład - lub powinienem powiedzieć, ramy czasowe - różne grupy serwerów, będąc w stanie to zrobić dynamicznie, z ostrzegając perspektywę, innymi słowy, w środku nocy, podczas mojego okna konserwacji, oczekuję, że mój procesor będzie działał na poziomie 80 procent w oparciu o wszystkie bieżące czynności konserwacyjne. Mogę więc chcieć podnieść progi wyżej, w tych przedziałach czasowych, a może w środku dnia, kiedy nie mam tak dużej aktywności.

Są to pewne rzeczy, które oczywiście będą środowiskowe, ale rzeczy, które możesz zastosować do tego, co jest zarządzane, aby pomóc ci efektywniej zarządzać tym środowiskiem i ułatwić to. Innym obszarem jest oczywiście ogólne dostarczanie raportów i informacji, aby móc odpowiedzieć na tego rodzaju pytania „co, jeśli”. Jeśli właśnie dokonałem zmiany w moim środowisku, chcę zrozumieć, jaki był ten wpływ, aby móc zastosować tę samą zmianę w innych instancjach lub innych bazach danych w moim środowisku. Chcę mieć trochę informacji lub amunicji, aby dokonać tej zmiany z pewnym spokojem i wiedząc, że to będzie dobra zmiana. Tak więc, będąc w stanie sporządzać raporty porównawcze, móc klasyfikować moje instancje SQL, móc porównywać moje bazy danych względem siebie, mówiąc: „Który jest moim największym konsumentem procesora?” Lub który z nich zajmuje najwięcej czasu warunki oczekiwania i tym podobne? Wiele z tych informacji będzie dostępnych również w narzędziu.

I wreszcie, jest to po prostu ogólna umiejętność, że potrzebujesz narzędzia, które będzie w stanie poradzić sobie w każdej sytuacji, która nadarzy się na twojej drodze, a więc mam na myśli to, że jeśli masz duże środowisko z dużą ilością instancjach, prawdopodobnie napotkasz sytuacje, w których musisz wyciągnąć metryki, które tradycyjnie nie są metrykami, które DBA chciałby nawet monitorować w niektórych przypadkach, w zależności od konkretnej sytuacji. Tak więc posiadanie narzędzia, które można rozszerzać, aby móc dodawać dodatkowe metryki i móc korzystać z tych metryk w tej samej formie i stylu, w jakim byś ich używał, gdybyś używał gotowego produktu na przykład metryka. Tak więc, możliwość uruchamiania raportów, zdolność do ostrzegania, linia bazowa - wszystko, o czym mówiono - jest również kluczową częścią możliwości przeprowadzenia tego prognozowania i uczynienia go tak, aby uzyskać odpowiedzi, których szukasz, aby móc udzielić odpowiedzi decyzje te posuwają się naprzód.

Teraz, w sposób, w jaki robi to Menedżer diagnostyczny, mamy scentralizowaną usługę, grupę usług, która działa, zbiera dane dla instancji od 2000 do 2016. Następnie bierzemy te dane i umieszczamy je w centralnym repozytorium, a następnie, co dobrze robimy z tymi danymi, oczywiście, robimy wiele, aby zapewnić dalszy wgląd. Teraz oprócz tego - i jednej z rzeczy, których tu nie ma - jest także usługa, która działa w środku nocy, która jest naszą usługą analizy predykcyjnej i która powoduje pewne załamanie liczb i pomaga zrozumieć i pomagać jako DBA lub działający DBA, aby móc formułować tego rodzaju rekomendacje, a także zapewniać wgląd w podstawowe wartości.

Tak więc, co chciałbym zrobić, a to tylko szybki przykład architektury, wielkim na wynos tutaj nie ma żadnych agentów ani usług, którzy faktycznie siedzą w instancjach, którymi zarządzasz. Ale to, co lubię robić, to po prostu zabrać cię do aplikacji tutaj i dać ci szybką wersję demonstracyjną. I pozwól mi też wyjść i sprawić, by tak się stało. Więc daj mi znać, myślę, że Eric, widzisz to w porządku?

Eric Kavanagh: Mam to teraz, tak.

Bullett Manale: OK, więc przeprowadzę cię przez niektóre z tych części, o których mówiłem. Zasadniczo zacznijmy od rzeczy, które są bardziej zgodne z herezjami, czegoś, co musisz zrobić, lub tutaj jest coś, co będzie momentem w przyszłości i miało dać ci wgląd w to. I jest to w stanie naprawdę przewidywać - lub powinienem powiedzieć dynamicznie przewidywać - rzeczy, które się dzieją. Teraz, w przypadku raportów, jedną z rzeczy, które mamy w narzędziu, są trzy różne raporty prognozowania. I w przypadku, na przykład, prognozy bazy danych, co prawdopodobnie zrobiłbym w sytuacji, gdybym był w stanie przewidzieć rozmiar bazy danych w pewnym okresie czasu, a ja po prostu podam kilka przykładów tego. Więc wezmę moją bazę danych audytu, która jest dość intensywna we / wy - ma do niej dużo danych. Mamy, zobaczmy, dobrze zrób to tutaj i po prostu wybierzmy bazę danych opieki zdrowotnej tutaj.

Ale chodzi o to, że nie tylko widzę, na czym jest ta przestrzeń, mogę powiedzieć: „Spójrz, weźmy dane z ostatnich lat” - i zamierzam tu trochę sfałszować, tak naprawdę nie mam lat wartości danych, mam około dwóch miesięcy danych - ale ponieważ wybieram tutaj częstotliwość próbkowania miesięcy, będę mógł przewidzieć lub przewidzieć w tym przypadku kolejne 36 jednostek, ponieważ nasza częstotliwość próbkowania jest ustawiona na miesiące - to jest jednostka, to miesiąc - i wtedy byłbym w stanie, a następnie sporządzić raport, aby w zasadzie pokazać mi, gdzie spodziewamy się naszego przyszłego wzrostu dla tych trzech baz danych. Widzimy, że mamy do czynienia z różnym stopniem różnicy lub wariancji między trzema różnymi bazami danych, szczególnie w odniesieniu do ilości danych, które zużywają historycznie.

Widzimy, że punkty danych reprezentują dane historyczne, a następnie linie, które dostarczą nam prognozę, wraz z liczbami, które ją potwierdzą. Więc możemy to zrobić na poziomie stołu, możemy to zrobić nawet na poziomie dysku, gdzie mogę przewidzieć, jak duże będą moje dyski, w tym punkty montowania. Bylibyśmy w stanie przewidzieć ten sam rodzaj informacji, ale ponownie, w zależności od częstotliwości próbkowania, pozwolą mi ustalić, ile jednostek i gdzie zabieramy to, co chcemy prognozować. Zauważ też, że mamy różne typy typów prognoz. Masz więc wiele opcji i elastyczność, jeśli chodzi o czas na prognozowanie. Teraz to jedno, co należy zrobić, podając konkretną datę i mówiąc „Hej, w tym dniu spodziewamy się wzrostu liczby twoich danych”. Oprócz tego możemy ci zapewnić z innymi spostrzeżeniami związanymi z niektórymi analizami, które przeprowadzamy w czasie wolnym od pracy, oraz z usługą, gdy jest ona uruchomiona. Jedną z rzeczy, które robi, jest próba przewidywania rzeczy, które prawdopodobnie się wydarzą, na podstawie historii, kiedy coś się wydarzyło w przeszłości.

Możemy więc zobaczyć tutaj, w rzeczywistości, prognoza dostarcza nam wglądu w prawdopodobieństwo, że będziemy mieć problemy przez cały wieczór w oparciu o rzeczy, które powtórzyły się w przeszłości. Więc oczywiście jest to świetne, szczególnie jeśli nie jestem DBA, mogę na nie patrzeć, ale co jest jeszcze lepsze, jeśli nie jestem DBA, ta zakładka analizy. Tak więc, zanim pojawiło się to w narzędziu, przejrzeliśmy produkt i pokazaliśmy go ludziom: „To świetnie, widzę te wszystkie liczby, widzę wszystko, ale nie wiem, co robić” (śmiech) „jak wynik tego. ”A więc to, co tu mamy, jest lepszym sposobem, abyś mógł zrozumieć, czy zamierzam podjąć działania, aby pomóc w wydajności, czy zamierzam podjąć działania, aby nawet pomóc mojemu zdrowiu środowisko, mając możliwość rankingowego sposobu przedstawiania tych rekomendacji, a także przydatnych wskazówek w informacji, aby dowiedzieć się więcej o tych rekomendacjach i faktycznie mając nawet zewnętrzne linki do niektórych z tych danych, które pokażą mi i zabiorą mnie do powodów, dla których te rekomendacje są zrobione.

W wielu przypadkach jest w stanie dostarczyć skrypt, który zautomatyzuje, jak powiedziałem, rozwiązanie tych problemów. Teraz część tego, co robiliśmy tutaj z tą analizą - i pokażę ci, kiedy wchodzę, aby skonfigurować właściwości tego wystąpienia, i przechodzę do sekcji konfiguracji analizy - mamy wiele różnych kategorii, które są tutaj wymienione, i częściowo mamy optymalizację indeksu i optymalizację zapytań. Ocenialiśmy więc nie tylko same metryki i tego typu rzeczy, ale także takie rzeczy, jak obciążenia i indeksy. W tym przypadku dobrze wykonaj dodatkową analizę indeksu hipotetycznego. Jest to więc jedna z tych sytuacji, w których nie chcę, w wielu przypadkach nie chcę dodawać indeksu, jeśli nie muszę. Ale w pewnym momencie istnieje punkt zwrotny, w którym mówię: „Cóż, tabela osiąga rozmiar lub rodzaje zapytań, które są uruchamiane w ramach obciążenia, mają teraz sens dodawanie indeksu. Ale nie miałoby to sensu może sześć tygodni wcześniej. ”To pozwala ci dynamicznie uzyskać wgląd w rzeczy, które prawdopodobnie, tak jak powiedziałem, poprawią wydajność w oparciu o to, co dzieje się w środowisku, co dzieje się w obrębie obciążeń i robiąc takie rzeczy.

Otrzymujesz tutaj wiele dobrych informacji, a także możliwość automatycznej optymalizacji tych rzeczy. Jest to więc kolejny obszar, w którym moglibyśmy pomóc, jeśli chodzi o tak zwaną analizę predykcyjną. Poza tym, powinienem powiedzieć, że mamy także inne obszary, które moim zdaniem po prostu nadają się do pomocy w podejmowaniu decyzji. A kiedy mówimy o podejmowaniu decyzji, po raz kolejny, mogąc spojrzeć na dane historyczne, daj nam wgląd w to, gdzie powinniśmy być, aby poprawić tę wydajność.

Teraz jedną z rzeczy, które możemy zrobić, jest bazowy wizualizator, który pozwala nam selektywnie wybierać dowolne parametry, które chcielibyśmy - i pozwól mi znaleźć tutaj przyzwoitą - Będę używać procesora SQL, ale chodzi o to, że możesz przejść z powrotem przez wiele tygodni, aby namalować te zdjęcia, aby zobaczyć, kiedy są wartości odstające, aby ogólnie powiedzieć, gdzie ta wartość spada w okresach, w których zbieramy dane. Poza tym zauważysz również, że kiedy przejdziemy do samej instancji, mamy możliwość skonfigurowania naszych linii bazowych. A linie bazowe są naprawdę ważną częścią możliwości automatyzacji rzeczy, a także możliwości powiadamiania o nich. A wyzwaniem, jak powiedziałaby większość DBA, jest to, że twoje środowisko nie zawsze działa tak samo, w ciągu dnia, w porównaniu do wieczora i co tam więcej, jak wspominaliśmy wcześniej w przykładzie z okresami konserwacji, kiedy mają wysoki poziom procesora lub cokolwiek, co może się dziać.

Tak więc w tym przypadku, z tymi rzeczywistymi wartościami podstawowymi, możemy mieć wiele poziomów bazowych, więc mogę mieć na przykład poziom bazowy, to znaczy w godzinach pracy. Ale równie łatwo mogę stworzyć punkt odniesienia dla moich godzin produkcji. Chodzi o to, że kiedy wchodzimy w instancję SQL i faktycznie mamy te wiele linii bazowych, wtedy będziemy w stanie przewidzieć i być w stanie wykonać pewien rodzaj automatyzacji, pewnego rodzaju naprawy lub po prostu alarmować w ogóle, inaczej specyficzne dla tych okien czasu. Tak więc jedną z rzeczy, które tutaj zobaczycie, jest to, że generowane przez nas linie bazowe wykorzystują dane historyczne do dostarczenia tej analizy, ale co ważniejsze, mogę zmienić te progi statycznie, ale również mogę je zautomatyzować dynamicznie. Tak więc, gdy pojawia się okno konserwacji, lub powinienem powiedzieć, okno linii podstawowej konserwacji, progi te automatycznie zmieniają się w zależności od obciążeń, które napotykam w tym oknie czasu, w porównaniu z może w środku dnia, kiedy moje obciążenia nie są tak wiele, gdy obciążenia nie są tak imponujące.

Jest to więc coś innego, o czym należy pamiętać, jeśli chodzi o poziom podstawowy. Oczywiście będą one dla ciebie naprawdę pomocne, jeśli chodzi o zrozumienie tego, co jest normalne i możliwość zrozumienia, angażuj się, gdy zabraknie Ci zasobów. Innym rodzajem rzeczy, które mamy w tym narzędziu, które pomogą ci podejmować decyzje, oprócz linii bazowej i możliwości ustawiania alertów wokół tych linii bazowych i progów, które tworzysz dynamicznie, jest jak powiedziałem wcześniej: po prostu mogę uruchomić całą masę raportów, które pomogą mi odpowiedzieć na pytania o to, co się dzieje.

Na przykład, gdybym miał 150 instancji, którymi zarządzam - w moim przypadku nie, więc musimy tu zagrać w udawaną grę - ale gdybym miał wszystkie moje instancje produkcyjne i musiałem zrozumieć, gdzie jest obszar Potrzebuję uwagi, innymi słowy, jeśli będę miał ograniczony czas na wykonanie jakiegoś rodzaju administracji w celu poprawy wydajności, chcę skupić się na kluczowych obszarach. Powiedziawszy to, mógłbym powiedzieć: „W oparciu o to środowisko, uszereguj moje instancje względem siebie i daj mi ten ranking według potyczki”. Więc czy użycie dysku, użycie pamięci, czy czeka, czy czas reakcji jestem w stanie skorelować - lub powinienem powiedzieć rangę - te przypadki ze sobą. Oczywiście instancja, która znajduje się na górze każdej listy, jeśli jest to ta sama instancja, to prawdopodobnie coś, na czym naprawdę chcę się skupić, ponieważ oczywiście jest to znowu na górze listy.

W narzędziu masz więc wiele raportów, które pomogą ci w rankingu środowiska na poziomie instancji; możesz to zrobić również na poziomie bazy danych, gdzie mogę porównać swoje bazy danych. W szczególności dla progów i obszarów, które mogę ustawić, mogę nawet ustawić tutaj symbole wieloznaczne, jeśli chcę, aby skupić się tylko na określonych bazach danych, ale chodzi o to, że mogę porównywać moje bazy danych w ten sam sposób. Ponadto, o ile inne rodzaje analizy porównawczej i duża w tym narzędziu, są analizą bazową, którą mamy. Jeśli przewiniesz w dół do widoku usługi tutaj, zobaczysz, że jest to podstawowy raport statystyczny. Teraz ten raport oczywiście pomoże nam zrozumieć nie tylko, jakie są wartości metryk, ale w konkretnym przypadku mógłbym wyjść, a dla każdej z tych metryk być w stanie faktycznie spojrzeć na linie bazowe tych metryk.

Tak więc, cokolwiek by to było, jako procent lub cokolwiek, co mógłbym wyjść i powiedzieć: „Zobaczmy linię bazową tego załamania w ciągu ostatnich 30 dni”, w którym to przypadku pokaże mi rzeczywiste wartości w porównaniu do linii bazowej i Mógłbym oczywiście podjąć pewne decyzje na podstawie tych informacji, więc jest to jedna z tych sytuacji, w których zależy to od pytania, jakie zadajesz w tym czasie. Ale to oczywiście pomoże ci w przypadku wielu tych pytań. Chciałbym powiedzieć, że mamy jeden raport, który to wszystko robi, i jest to coś w rodzaju łatwego raportu, w którym naciskasz i naciskasz, a on po prostu odpowiada na każde pytanie „co, jeśli”, na które kiedykolwiek możesz odpowiedzieć. Ale w rzeczywistości będziesz mieć wiele atrybutów i wiele opcji do wyboru w tych rozwijanych menu, aby móc sformułować te pytania typu „co, jeśli”, których szukasz.

Dlatego wiele z tych raportów ma na celu udzielenie odpowiedzi na tego rodzaju pytania. Dlatego tak naprawdę ważne jest, aby te raporty, a ponadto wszystkie rzeczy, które już pokazaliśmy w narzędziu, jak wspomniałem wcześniej, mają elastyczność wprowadzania nowych wskaźników, którymi można zarządzać, a nawet mogą tworzyć liczniki, lub zapytania SQL, które są uwzględnione w interwałach odpytywania, aby pomóc mi odpowiedzieć na te pytania, które być może po wyjęciu z pudełka, których nie spodziewaliśmy się monitorować, możesz dodać te rzeczy. I wtedy będziesz w stanie robić wszystkie te same rzeczy, które ci pokazałem: bazować, uruchamiać raporty i tworzyć raporty na podstawie tych danych, a także być w stanie odpowiadać i wykonywać wiele różnych rodzajów rzeczy, które tu pokazuję.

Teraz, oprócz tego - i jedną z rzeczy, na które ostatnio ostatnio wpadamy dość często, jest - po pierwsze, wszyscy przerzucali lub przestawiali się na maszyny wirtualne. A teraz mamy wielu ludzi, którzy udają się do chmury. I pojawia się wiele pytań dotyczących tego rodzaju rzeczy. Czy sensowne jest dla mnie przejście do chmury? Czy zamierzam zaoszczędzić pieniądze, przenosząc się do chmury? Gdybym miał umieścić te rzeczy na maszynie wirtualnej na maszynie z zasobami współdzielonymi, ile pieniędzy mogę zaoszczędzić? Tego rodzaju pytania, oczywiście, również się pojawią. Mając to na uwadze, należy pamiętać o tym, że dzięki Diagnostic Manager możemy dodawać i pobierać ze zwirtualizowanych środowisk VMware i Hyper-V. Możemy również dodawać instancje znajdujące się w chmurze, więc w środowiskach takich jak Azure DB, na przykład, a nawet RDS, możemy również pobierać dane z tych środowisk.

Istnieje więc duża elastyczność i możliwość odpowiedzi na te pytania, ponieważ dotyczą one innych rodzajów środowisk, do których zmierzamy. Nadal jest wiele pytań na ten temat, a kiedy widzimy, jak ludzie konsolidują te środowiska, będą musieli również móc odpowiedzieć na te pytania. To całkiem niezły przegląd, powiedzmy, Menedżera diagnostycznego, ponieważ odnosi się do tego tematu. Wiem, że pojawił się temat wywiadu gospodarczego, a my mamy również narzędzie do wywiadu gospodarczego, o którym dzisiaj nie rozmawialiśmy, ale zapewni ono również wgląd w odpowiedzi na tego rodzaju pytania związane z kostkami i wszystkie te różne rodzaje rzeczy. Ale mam nadzieję, że był to dobry przegląd, przynajmniej pod względem tego, jak ten produkt może pomóc w opracowaniu dobrego planu.

Eric Kavanagh: W porządku, dobre rzeczy. Tak, wyrzucę to Rickowi, jeśli nadal tam jest. Rick, masz jakieś pytania?

Rick Sherman: Tak, więc po pierwsze, to jest świetne, podoba mi się. Szczególnie podoba mi się rozszerzenie na maszyny wirtualne i chmury. Widzę, że wielu programistów myśli, że jeśli jest w chmurze, nie trzeba go dostroić. Więc-

Bullett Manale: Racja, wciąż musimy za to zapłacić, prawda? Nadal musisz płacić za cokolwiek, co ludzie umieszczają w chmurze, więc jeśli jest źle działająca lub powoduje wiele cykli procesora, to więcej pieniędzy musisz zapłacić, więc nie, nadal musisz mierzyć te rzeczy, absolutnie.

Rick Sherman: Tak, widziałem wiele słabych projektów w chmurze. Chciałem zapytać, czy ten produkt będzie również używany - wiem, że wspomniałeś o produkcie BI i masz mnóstwo innych produktów, które współdziałają ze sobą - ale czy zacząłbyś przyglądać się wydajności SQL, pojedynczym zapytaniom w tym narzędziu? A może byłyby do tego wykorzystane inne narzędzia?

Bullett Manale: Nie, to absolutnie. To jedna z rzeczy, których nie opisałem i chciałem, to część zapytań. Mamy wiele różnych sposobów identyfikowania wydajności zapytania, niezależnie od tego, czy jest ono powiązane, a konkretnie z oczekiwaniem, jakie widzimy w tym widoku, lub czy jest związane z ogólnym zużyciem zasobów przez zapytania, istnieje wiele sposobów analizy zapytania występ. Jego czas trwania, procesor, operacje we / wy i jeszcze raz możemy również spojrzeć na same obciążenia, aby uzyskać wgląd. Możemy podać zalecenia w sekcji analizy, a także mamy wersję internetową, która zawiera informacje dotyczące samych zapytań. Mogę więc uzyskać rekomendacje dotyczące brakujących indeksów oraz możliwość przeglądania planu wykonania i tego rodzaju rzeczy; jest to również możliwość. Tak więc absolutnie możemy zdiagnozować zapytania na siedem sposobów do niedzieli (śmiech) i być w stanie zapewnić ten wgląd w liczbę wykonań, czy to zużycie zasobów, oczekiwania, czas trwania, wszystkie te dobre rzeczy.

Rick Sherman: Ok świetnie. A jakie jest obciążenie samych instancji z całym tym monitorowaniem?

Bullett Manale: To dobre pytanie. Wyzwanie związane z odpowiedzią na to pytanie polega na tym, że wszystko zależy, podobnie jak wszystko inne. Wiele z tego, co ma do zaoferowania nasze narzędzie, zapewnia elastyczność, a częścią tej elastyczności jest to, że możesz powiedzieć mu, co należy zbierać, a czego nie. Na przykład przy samych zapytaniach nie muszę zbierać informacji o czekaniu, bo mogę. Potrafię zbierać informacje związane z zapytaniami, które przekraczają czas wykonania. Jako przykład tego, gdybym wszedł do konfiguracji monitora zapytań i powiedziałbym „Zmieńmy tę wartość na zero”, rzeczywistość jest taka, że po prostu sprawia, że narzędzie zbiera każde uruchomione zapytanie, a tak naprawdę nie duch tego, dlaczego tak jest, ale ogólnie mówiąc, jeśli chciałbym dostarczyć pełną próbkę danych dla wszystkich zapytań, mógłbym to zrobić.

Jest to więc bardzo zależne od twoich ustawień, ogólnie mówiąc, od razu po wyjęciu z pudełka. Jest wszędzie od około 1–3 procent kosztów ogólnych, ale istnieją inne warunki, które będą miały zastosowanie. Zależy to również od tego, ile zapytań o porty są uruchomione w twoim środowisku, prawda? Zależy to również od metody zbierania tych zapytań i od wersji SQL. Na przykład program SQL Server 2005 nie był w stanie wyciągać danych z rozszerzonych zdarzeń, podczas gdy w tym celu korzystaliśmy ze śledzenia. Tak więc byłoby trochę inaczej pod względem sposobu, w jaki chcielibyśmy zebrać te dane, ale to powiedziało, tak jak powiedziałem, jesteśmy tutaj, bo chyba od 2004 roku z tym produktem. Minęło już sporo czasu, mamy tysiące klientów, więc ostatnią rzeczą, którą chcemy zrobić, jest narzędzie do monitorowania wydajności, które powoduje problemy z wydajnością (śmiech). Staramy się więc unikać tego w jak największym stopniu, ale ogólnie rzecz biorąc, około 1–3 procent jest dobrą zasadą.

Rick Sherman: OK, i to jest dość niskie, więc to jest wspaniałe.

Eric Kavanagh: Dobry. Robin, masz jakieś pytania?

Robin Bloor: Przepraszam, byłem niemy. Masz możliwość korzystania z wielu baz danych, a ja jestem zainteresowany tym, jak możesz patrzeć na wiele baz danych, a zatem możesz wiedzieć, że większa baza zasobów jest prawdopodobnie podzielona między różne maszyny wirtualne i tak dalej. Jestem zainteresowany tym, jak ludzie faktycznie z tego korzystają. Jestem zainteresowany tym, co robią klienci. Bo to mi się wydaje, no cóż, z pewnością, kiedy bałam się bazami danych, coś, czego nigdy nie miałem pod ręką. I rozważałbym tylko jeden przypadek w jakikolwiek sensowny sposób w danym momencie. Jak ludzie to wykorzystują?

Bullett Manale: Mówiąc ogólnie, mówisz ogólnie o samym narzędziu? Jak oni tego używają? Chodzi mi ogólnie o to, aby mieć centralny punkt obecności środowiska. Mając spokój i wiedząc, że jeśli patrzą na ekran i widzą zieleń, wiedzą, że wszystko jest dobrze. Kiedy pojawiają się problemy i oczywiście większość przypadków z perspektywy DBA, wiele razy te problemy pojawiają się, gdy znajdują się przed konsolą, dzięki czemu można być powiadamianym, gdy tylko problem się pojawi. Ale oprócz tego, będąc w stanie zrozumieć, kiedy problem się zdarza, być w stanie dotrzeć do sedna informacji, która dostarcza im pewnych przeciwwskazań, dlaczego tak się dzieje. I to jest, jak sądzę, największa część: bycie proaktywnym wobec tego, nie bycie reaktywnym.

Większość DBA, z którymi rozmawiam - i nie wiem, to jest ich dobry procent - niestety wciąż są w reaktywnym środowisku; czekają, aż konsument podejdzie do nich i powie im, że jest problem. Widzimy więc wielu ludzi próbujących się oderwać od tego i myślę, że to duża część powodu, dla którego ludzie lubią to narzędzie, ponieważ pomaga im być aktywnym, ale zapewnia im również wgląd w to, co się dzieje , na czym polega problem, ale w wielu przypadkach co najmniej znajdujemy - i może to tylko DBA nam to mówi - ale DBA, postrzeganie jest zawsze ich problemem, nawet jeśli to programista aplikacji, który napisał aplikację które nie napisały tego poprawnie, to one ponoszą winę, ponieważ biorą tę aplikację do swoich systemów lub serwerów, a następnie, gdy wydajność jest niska, wszyscy wskazują na DBA mówi: „Hej, to twoja wina”.

Tak więc to narzędzie jest często używane, aby pomóc DBA w stwierdzeniu: „Hej, tu leży problem, a nie ja.” (Śmiech) Musimy popraw to, niezależnie od tego, czy będzie to zmiana zapytań, czy cokolwiek by to nie było. W niektórych przypadkach spadnie to do ich zakresu odpowiedzialności, ale przynajmniej będzie miało narzędzie, które pomoże im to zrozumieć i wiedzieć o tym, a robienie tego w odpowiednim czasie jest oczywiście idealnym podejściem.

Robin Bloor: Tak, większość stron, które znam, ale minęło trochę czasu, odkąd tam byłem, przeglądając różne witryny z wieloma bazami danych, ale przede wszystkim odkryłem, że będą DBA, które skupią się na kilku bazy danych. I to byłyby bazy danych, które gdyby kiedykolwiek upadły, byłby to naprawdę duży problem dla biznesu i tak dalej. A pozostałe zbierają statystyki od czasu do czasu, żeby zobaczyć, czy nie zabrakło im miejsca i nigdy na nich nie patrzą. Podczas gdy robiłeś wersję demo, patrzyłem na to i myślałem dobrze, w taki czy inny sposób, rozszerzasz, po prostu udostępniając coś takiego dla baz danych, o których często nikt się nie przejmował, ponieważ mają one wzrost danych , mają również czasami wzrost aplikacji. Rozszerzasz zasięg DBA w dość dramatyczny sposób. Więc o to tak naprawdę chodzi, czy to dzięki takiemu zestawowi narzędzi możesz w końcu dać usługę DBA każdej bazie danych w sieci korporacyjnej?

Bullett Manale: Pewnie, mam na myśli, wyzwanie polega na tym, że tak jak powiedziałeś dość elokwentnie, jest to, że istnieją takie bazy danych, na których dbają DBA, a potem są takie, na których im tak bardzo nie zależy. I sposób, w jaki ten konkretny produkt, sposób, w jaki jest licencjonowany, jest dla poszczególnych instancji. Jest więc, jak sądzę, próg, kiedy ludzie decydują „Hej, to nie jest wystarczająco krytyczny przypadek, że chcę nim zarządzać za pomocą tego narzędzia”. To powiedziawszy, istnieją inne narzędzia, które mamy, które są bardziej Myślę, że dostosowując się do tych mniej ważnych wystąpień SQL. Jednym z nich byłby Menedżer zapasów, w którym przeprowadzamy lekkie kontrole kondycji względem instancji, ale oprócz tego robimy odkrycie, więc identyfikujemy nowe instancje, które zostały wprowadzone do Internetu, a następnie, od tego momentu, jako DBA mogę powiedzieć: „OK, oto nowa instancja SQL, czy to teraz Express? Czy jest to wersja bezpłatna czy wersja korporacyjna? ”To prawdopodobnie pytanie, które chcę sobie zadać, ale po drugie, jak ważna jest dla mnie ta instancja? Jeśli to nie jest tak ważne, mógłbym uruchomić to narzędzie i zrobić to, ogólne, co nazwałbym ogólnymi sprawdzeniami kondycji w tym sensie, że są to podstawowe rodzaje rzeczy, na których mi zależy jako DBA: Czy dysk się zapełnia? Czy serwer reaguje na problemy? Najważniejsze rzeczy, prawda?

Podczas gdy w Diagnostic Manager, narzędzie, które właśnie ci pokazałem, przejdzie do poziomu zapytania, przejdzie do rekomendacji indeksów, spojrzy na plan wykonania i wszystkie inne dobre rzeczy, podczas gdy jest to głównie skoncentrowane kto jest właścicielem, co ja posiadam i kto za to odpowiada? Jakie mam dodatki Service Pack i poprawki? I czy moje serwery działają z głównymi składnikami tego, co uważam za zdrową instancję SQL? Aby odpowiedzieć na twoje pytanie, jest trochę mieszanki. Kiedy ludzie patrzą na to narzędzie, zwykle patrzą na bardziej krytyczny zestaw instancji. To powiedziawszy, mamy ludzi, którzy kupują każdą instancję i zarządzają nią, więc to po prostu zależy. Ale mówię, ogólnie rzecz biorąc, zdecydowanie istnieje próg tych ludzi, którzy uważają, że ich środowisko jest wystarczająco ważne, aby mieć takie narzędzie do zarządzania tymi instancjami.

Robin Bloor: Dobra, kolejne pytanie, zanim przekażę je Ericowi. Odnosząc wrażenie, po obejrzeniu branży, można odnieść wrażenie, że bazy danych wciąż mają życie, ale wszystkie dane wlewają się do wszystkich tych jezior danych i tak dalej. Tak naprawdę szum i szum nigdy nie odzwierciedlają rzeczywistości, więc interesuje mnie, jaką rzeczywistość tam postrzegasz? Czy ważne są bazy danych w organizacji, czy doświadczają tradycyjnego wzrostu danych, o którym myślałem, że to 10 procent rocznie? A może rosną jeszcze bardziej? Czy duże zbiory danych powodują, że te bazy danych są balonami? Jaki obraz widzisz?

Bullett Manale: Myślę, że w wielu przypadkach niektóre dane były przenoszone do tych innych segmentów, w których ma to większy sens, gdy dostępne są inne technologie. Od niedawna niektóre z większych danych. Ale te bazy danych, powiedziałbym, są trudne do uogólnienia w wielu przypadkach, ponieważ każdy jest trochę inny. Ogólnie jednak widzę pewne rozbieżności. Widzę, jak powiedziałem, ludzie w wielu przypadkach przechodzą na modele elastyczne, ponieważ chcą zwiększyć zasoby, a nie tyle w innych obszarach. Niektórzy ludzie przenoszą się do dużych zbiorów danych. Ale trudno jest poczuć, powiedzmy, postrzeganie, ponieważ ogólnie rzecz biorąc, ludzie, z którymi rozmawiam, mają tradycyjne bazy danych i używają tego w środowisku SQL Server.

To powiedziawszy, jeśli chodzi o sam SQL, zdecydowanie uważam, że zyskuje on na rynku. I myślę, że jest wielu ludzi, którzy wciąż zmierzają w kierunku SQL z innych miejsc, takich jak Oracle, ponieważ jest to bardziej przystępne cenowo i wydaje się, że jest oczywiste, ponieważ wersje SQL stają się bardziej zaawansowane - i widzisz to z nowszymi rzeczami, które będą z SQL, jeśli chodzi o szyfrowanie i wszystkie inne funkcje, które czynią go środowiskiem lub platformą bazy danych - to oczywiście bardzo krytyczne dla misji. Myślę, że też to widzieliśmy. Gdzie widzisz zmianę, nadal się dzieje. Mam na myśli, że działo się to 10 lat temu, i myślę, że nadal dzieje się w kategoriach SQL Server, gdzie rosną środowiska i rośnie udział w rynku.

Robin Bloor: OK, Eric, zakładam, że publiczność ma pytanie czy dwa?

Eric Kavanagh: Tak, pozwól mi rzucić ci jeden szybki. Właściwie to całkiem dobre pytanie. Jeden z uczestników pyta, czy to narzędzie powie mi, czy tabela może potrzebować indeksu, aby przyspieszyć zapytanie? Jeśli tak, czy możesz podać przykład?

Bullett Manale: Tak, więc nie wiem, czy mam taki do konkretnego dodawania indeksu, ale możesz zobaczyć tutaj, mamy tutaj rekomendacje dotyczące fragmentacji. Wierzę też, że właśnie to mieliśmy i było to częścią Menedżera diagnostycznego oferującego wersję internetową, w której mówi mi, że brakuje mi indeksu. Możemy przeglądać te rekomendacje, a to pokaże nam potencjalny zysk z tego, indeksując te informacje. Inną rzeczą, o której powinienem tylko wspomnieć, jest to, że kiedy wykonamy zalecenia, dla wielu z nich skrypt zostanie dla niego zbudowany. To nie jest dobry przykład, ale można zobaczyć, tak, sytuacje, w których indeks - albo duplikat indeksu, albo dodanie indeksu - poprawiłby wydajność, i jak powiedziałem wcześniej, robimy dużo że poprzez hipotetyczną analizę indeksu. Tak więc naprawdę pomaga w zrozumieniu obciążenia pracą, aby móc zastosować to do zalecenia.

Eric Kavanagh: To świetne rzeczy, a to pozwoli mi dobrze przejść do końcowych komentarzy tutaj. Robin, ja i Rick, od wielu lat słyszeliśmy, że mówi się o samodostrajających się bazach danych. Jest to samodostrajająca się baza danych! Mogę ci tylko powiedzieć: nie wierz im.

Bullett Manale: Nie wierz w szum.

Eric Kavanagh: Mogą istnieć pewne małe rzeczy, które są wykonywane dynamicznie, ale nawet to, możesz chcieć to sprawdzić i upewnić się, że nie robi czegoś, czego nie chcesz. Przez pewien czas potrzebowaliśmy takich narzędzi, aby zrozumieć, co dzieje się na poziomie bazy danych, i jak powiedział Robin, jeziora danych to fascynujące koncepcje, ale prawdopodobnie istnieje tak duża szansa na ich przejęcie, jak to jest możliwe. potwora z Loch Ness w najbliższym czasie. Powiedziałbym więc raz jeszcze, że w prawdziwym świecie jest dużo technologii baz danych, potrzebujemy ludzi, DBA, aby popatrzeć na te rzeczy i je zsyntetyzować. Możesz powiedzieć, że musisz wiedzieć, co robisz, aby te rzeczy działały. Ale potrzebujesz narzędzi, które dostarczą ci informacji, aby wiedzieć, co robisz. Podsumowując, DBA mają się dobrze.

I wielkie podziękowania dla Bullett Manale i naszych przyjaciół z IDERA. I oczywiście Rick Sherman i Robin Bloor. Archiwizujemy wszystkie te webcasty, więc wskocz online insideanalysis.com lub do naszej witryny partnerskiej www.techopedia.com, aby uzyskać więcej informacji na ten temat.

I dzięki temu pożegnajcie się, ludzie. Jeszcze raz dziękuję, dobrze porozmawiamy następnym razem. Dbać. PA pa.