Apache Beam – rozpocznij przygodę z Big Data
Apache Beam to project rozpoczęty w 2016 roku, bardzo mocno wspierany przez Google. Jego zadaniem jest stworzenie uniwersalnego modelu przetwarzania Big Data. Raz napisany kod, który przetwarza dane, powinien być [...]
Python Pandas – MEGA tutorial
Python Pandas to prawdopodobnie najpopularniejsza biblioteka na świecie do ładowania, czyszczenia, przygotowywania i analizowania danych. Czyli wszystkiego tego co zajmuje 80% czasu każdej osobie pracującej jako analityk danych czy też [...]
Rozpoznawanie twarzy dla każdego w 27 linijkach kodu Python
Wszyscy myślą, że rozpoznawanie twarzy to skomplikowany koncept nieosiągalny dla "zwykłego człowieka". Nic bardziej mylnego, Python oraz jego community przygotowali materiały które pozwalają osiągnąć ten efekt bez większego wysiłku. W następnych artykułach po kolei [...]
Różne odsłony joina
Rodzaje JOIN Ostatnio poznaliśmy sposób łączenia kilku tabel ze sobą za pomocą JOINA jest to skrócona nazwa, ponieważ można na przemienię używać tej klauzuli z INNER JOIN. Jak wskazuję nazwa jest to [...]
Orange Data Mining, Science & Visualization
Orange, to open sourcowe narzędzie do analizy danych. Stworzone przez słowacki uniwersytet. Proste, łatwe, skuteczne. Nie jest to zastępstwo do analizy w Python, R czy narzędziach takich jak SAS Data Miner, ale alternatywa, która [...]
Relacyjna baza danych. O co chodzi z tymi relacjami? SQL
Po co trzymać dane w kilku tabelach ? Wyobraź sobie sytuację, że baza danych składa się tylko i wyłącznie z jednej tabeli. W takiej sytuacji pozbywamy się problemu łączenia tabel i [...]
SQL – od czego zacząć ?
W dzisiejszym artykule omówimy „język” który jest idealnym narzędziem do zarządzania danymi, ale również może być nieodzownym elementem data science, chodzi o język zapytań SQL (ang. Structured Query Language) który jest używany do tworzenia, [...]
SQLite i Python – jak szybko i lekko zacząć używać bazy danych
Facebook Comments
Pelerynka Niewidka – OpenCV
Jesteś jednym z fanów Harrego Pottera i jego pelerynki niewidki? Też chciałeś zawsze taką mieć? Teraz jest już na wyciągnięcie ręki 🙂 W tym materiale będziemy bazować na informacjach przekazanych w poprzedzającym artykule z [...]
Zbiór danych Churn, czyli dane na temat klientów którzy rezygnują z usług
Churn jest to pojęcie które oznacza utratę klientów na rzecz konkurencji. Z punktu widzenia firmy, przewidzenie oraz utrzymanie klientów którzy chcą od nas odejść jest bardzo ważne, i w wielu przypadkach o wiele tańsze [...]
Jak zmienić theme / skórkę / kolor Jupyter Notebook
Jasny kolor Jupyter Notebook, może męczyć oczy. Na szczęście, w dość prosty sposób, możemy zmienić jego kolor. Zobaczmy jak. Uruchamiamy CMD w Anaconda Navigator Uruchamiamy Anaconda Navigator, z menu start, a następnie uruchamiamy CMD.exe [...]
Drzewo decyzyjne – wstęp oraz prosty przykład
Drzewo decyzyjne to narzędzie, powszechnie używane w Data Science do klasyfikacji. Jest również jednym z pierwszych koncepcji, którą należy opanować, aby zrozumieć bardziej złożone algorytmy jak lasy losowe. Poniżej zobaczymy, na czym polega drzewo [...]
SQLAlchemy – wyższy poziom operacji na bazach danych
Facebook Comments
Pandas – pivot table, czyli jak obracać tabele i sprawiać, aby były bardziej czytelne
Dane, które otrzymujemy często mogą pojawiać się w różnych formatach oraz ułożeniach. Często będziemy potrzebować innego punktu widzenia, z pomocą przychodzi nam funkcja pivot_table. Pozwala nam ona w prosty sposób pokazywać dane w wygodnej [...]
Jak zostać analitykiem danych / data scientist
Analityk danych, data miner, machine learning expert, data scientist, AI expert, data engineer, BI expert i tak dalej..... to wszystko są przyszłościowe i dobrze płatne zawody. Powody są proste. danych jest coraz więcej, a [...]
Sprawdź jakość powietrza z GIOŚ
Czym jest GIOŚ? Główny Inspektorat Ochrony Środowiska. Jedną z ciekawych rzeczy, która możemy znaleźć na ich stronie, jest API, które umożliwia nam odczytanie jakości powietrza z jednej z ponad 100 stacji, zlokalizowanych na terenie [...]
Kurs Python na YouTube !
Zapraszamy do NOWEGO kursu Python, dla początkujących na Youtube. Zaczniemy od podstaw Będzie dużo praktyki Będzie prosto i zrozumiale Zachęcamy do subskrypcji 🙂 https://www.youtube.com/watch?v=wrDdivuWqlM&t=2s
Rozkład normalny, w Python
Rozkład normalny, znany również jako rozkład Gaussa, jest najważniejszym i najbardziej pożądanym rozkładem z jakim mamy do czynienia w Data Science. W praktyce, będziemy sprawdzać czy zmienna ma rozkład normalny, często, i często będziemy [...]
Uczenie maszynowe: z nadzorem i bez nadzoru
Jedną z podstawowych koncepcji, którą należy zrozumieć w Data Science jest typ uczenia. Mianowicie 2 podstawowe typy, które pojawiają się w każdej literaturze – uczenie z nadzorem oraz bez nadzoru. Aby zrozumieć rodzaje uczenia [...]
Pokoloruj róże z OpenCV i Python
Jak widzieliśmy razem w materiale, http://analityk.edu.pl/czym-jest-obraz-dla-komputera/ pokazany był obraz człowieka z czerwoną różą na czarno-białym tle. . . W tym materiale przedstawiony będzie proces doprowadzający do powyższego efektu. [...]
Zbiór danych Titanic, kto i dlaczego przeżył
Absolutną klasyką analizy danych jest zbiór zawierający informacje na temat pasażerów legendarnego Titanica. Mamy informację czy dany pasażer przeżył, wiek, płeć, klasa itd. Wiele ciekawych danych, aby zadać sobie pytanie - czy to, [...]
Czym jest obraz dla komputera – OpenCV
Przetwarzanie obrazów jest jednym z najgorętszych tematów w kontekście sztucznej inteligencji i nowoczesnych technologii. Mimo skomplikowanych teorii korzystanie z niej jest osiągalnym tematem dla każdego z nas z lekkim zacięciem technicznym, może być wręcz [...]
Analiza koszykowa i cross selling w Python
Analiza koszykowa, opiera się o analizę historii zakupów w celu zrozumienia, jakie produktu kupowane są często razem. Tego typu reguły, są stosowane aby rekomendować, obecnym klientom, nabycie dodatkowych produktów i usług, które być [...]
World Happiness – od czego zależy szczęście
Od czego zależy, że społeczeństwo danego państwa jest szczęśliwe? Na to pytanie próbuje odpowiedzieć, co roczne badanie - 'World Happiness', w ramach którego, przeprowadza się ankiety w ponad 150 państwach. My, przyjrzymy się tym [...]
Seaborn – eleganckie wykresy w Python
Seaborn, to zgrabna oraz efektywna biblioteka, pozwalająca na szybkie tworzenie atrakcyjnych wykresów, w Python. Została, zbudowana na bazie biblioteki Matplotlib, jednocześnie wzbogacona o dodatkowe typy wykresów. Poniżej zobaczymy, jak z niej korzystać w praktyce. [...]
Python Pandas – wszystko co musisz wiedzieć, aby zacząć
Pandas, jest jednym z najbardziej rozbudowanych pakietów, do analizy danych, w Python. Scyzorykiem szwajcarskim. Możemy za jego pomocą, wczytywać dane, czyścić, modyfikować, a nawet analizować. Wszystko to co umożliwia nam SQL, Excel i [...]
Wstęp do biblioteki NumPy w Python
Biblioteka NumPy, w Python, została stworzona, aby umożliwić szybkie i sprawne operacje na macierzach. Każdy element jest tego samego typu - zazwyczaj są to liczby. Na jej podstawie stworzono, między innymi bibliotekę Pandas. Jest [...]
Python Pandas Tutorial – szybki przegląd zawartości DataFrame
W poprzednich lekcjach nauczyliśmy się tworzyć DataFrame. W tej lekcji zobaczymy jak szybko i łatwo możemy uzyskać podstawowe informacje na jego temat, takie jak liczba rekordów, typy kolumn, informacje o [...]
Python Pandas Tutorial – indeksy oraz funkcja loc
W tej lekcji, zajmiemy się przeglądaniem oraz modyfikacją DataFrame z użyciem indeksów. Poznamy nowe funkcje loc oraz iloc, oraz jeszcze mocniej rozpalimy naszą miłość do Pandas. Zaczynajmy! Zbiorem danych który [...]
Python Pandas Tutorial – funkcja apply
Funkcja Apply pozwala na o wiele bardziej rozbudowane operacje na rekordach DataFrame niż samo użycie nawiasów [] lub funcji loc. Koncepcja ten funkcji jest szeroko znana i stosowana w wielu bibliotekach do przetwarzania danych, [...]
Python Pandas Tutorial – typy danych
Pandas rozpoznaje, podobnie jak Python, różne typy danych - liczby, ciągle znaków itd. Prawda jest jednak taka, że nie przejmujemy się tym zbytnio, do czasu otrzymania związanego z typami danych błędu. Dopiero wtedy zaczyny [...]
Python Pandas Tutorial – groupowanie danych, z group by
Grupowanie, agregowanie, transformowanie danych jest to jedno z zadań które wykonuje bardzo często, każdy analityk danych. Nie jest więc zaskoczeniem, że i Pandas przychodzi tutaj z zestawem prostych, lecz skutecznych funkcji, takich jak [...]
Python Pandas Tutorial – unstack i pivot table
Pivot table (czyli tabela przestawna) jest wielu osobom dobrze znane z Excela. Pandas nie pozostaje z tyłu w tym temacie. W tej lekcji pokażę czym pivot table różni różni się od grupowania, które robiliśmy [...]
Python Pandas Tutorial – prosty DataFrame
Podstawowym typem danych z którym będziemy mieć do czynienia w Pandas to DataFrame. DataFrame, to nasza tabele z danymi. Będziemy tworzyć nasze DataFramy poprzez wczytanie danych z plików, baz danych lub też poprzez wygenerowanie [...]
Python Pandas Tutorial – merge i concat
W tej lekcji naszego Pandas tutoriala, pokaże Wam jak możemy łączyć ze sobą zbiory. Jeżeli ktoś zna SQL to będzie kojarzyć te operacja jako union i join. Natomiast w Pandas mamy do dyspozycji dwie [...]
Python Pandas Tutorial – praca z bazami danych i SQL
Do tej pory pracowaliśmy na danych pochodzących z plików, takich jak CSV czy XLS. Możliwości Pandas są jednak szersze. Bardzo dobrze współpracuje z bazami danych, których może odczytywać dane oraz [...]