Przejdź do treści

Features Detective App

Data utworzenia: 2024-10-30

Opis projektu

Celem projektu było stworzenie uniwersalnej aplikacji pozwalającej na wykrywanie najważniejszych cech w danym zbiorze danych. W skrócie - użytkownik wgrywa dane lub ładuje gotowy zbiór danych w odpowiednim formacie, następnie wybiera automatyczną detekcję kolumny, którą chce analizować, lub dokonuje tego wyboru samodzielnie. Na koniec otrzymuje wygenerowany wykres istotności cech, które mają największy wpływ na wcześniej wybraną kolumnę. Użytkownik otrzymuje również czytelny opis wykresu wraz z rekomendacjami - co można poprawić, aby np. ulepszyć analizowane dane.

Główne funkcjonalności

  • Użytkownik może załadować plik CSV/JSON z danymi lub użyć gotowego przykładowego zbioru danych
  • Użytkownik wskazuje kolumnę docelową → dodatkowo może skorzystać z automatycznej detekcji kolumny (generowanej przez LLM)
  • Aplikacja automatycznie rozpoznaje, czy załadowane dane dotyczą problemu regresji czy klasyfikacji i na tej podstawie dobiera odpowiedni algorytm treningu modelu AI
  • Na podstawie wytrenowanego modelu wyświetlany jest wykres zawierający najważniejsze cechy
  • Na koniec użytkownik otrzymuje czytelny opis wykresu wraz z rekomendacjami - jakie działania wdrożyć, aby poprawić wyniki związane z analizowaną kolumną docelową

Trening modelu ML

Wykorzystałem narzędzia PyCaret i zawarłem implementację w notatniku gotowym do pobrania:

Pobierz Notebook: Trening modelu

Umiejętności

  • Python
  • Langfuse
  • OpenAI
  • Streamlit
  • PyCaret (Classification & Regression)
  • Pandas
  • Matplotlib
  • Instructor
  • Pydantic
  • Boto3

Zdjęcia

Tytuł Wybór kolumny Rekomendacje Wykres

Linki

Link do repozytorium