Robinson Chatbot

Data utworzenia: 2025-01-31

Opis projektu

Projekt Robinson Chatbot eksploruje implementację technik Retrieval-Augmented Generation (RAG) do stworzenia inteligentnego agenta konwersacyjnego posiadającego wiedzę o "Robinsonie Crusoe". System łączy najnowocześniejsze modele językowe zarówno od OpenAI, jak i Amazon Bedrock z zaawansowanymi metodami wyszukiwania tekstu, aby zapewnić dokładne, kontekstowo istotne odpowiedzi oparte na treści powieści. Poprzez intensywne eksperymenty z różnymi strategiami chunkingu, modelami embeddingów i technikami prompt engineering, projekt demonstruje jak architektury RAG mogą skutecznie rozszerzać możliwości LLM dla aplikacji domenowych, jednocześnie minimalizując halucynacje i poprawiając dokładność faktyczną.

Główne funkcjonalności

Implementacja różnych metod chunkingu tekstu (np. po paragrafach, stały rozmiar tokenów, po rozdziałach) do optymalizacji wyszukiwania informacji
Eksperymenty z różnymi modelami embeddingów do tworzenia semantycznych reprezentacji wektorowych
Zaawansowane wyszukiwanie podobieństwa przy użyciu bazy wektorowej FAISS dla efektywnego wyszukiwania informacji
Porównanie wydajności między modelami OpenAI (gpt-4o i gpt-4o-mini) a modelami Amazon Bedrock (Amazon Titan Text Express V1 i Amazon Titan Text Embeddings E1)
Techniki prompt engineering do optymalizacji wykorzystania kontekstu i jakości odpowiedzi
Interaktywna aplikacja Streamlit do przyjaznej użytkownikowi interakcji z chatbotem o Robinsonie Crusoe
Kompleksowy framework ewaluacyjny do mierzenia dokładności, trafności i spójności odpowiedzi

Umiejętności

Python
OpenAI
Amazon Bedrock
AWS
NumPy
FAISS
RAG
Boto3
NLTK
Streamlit
Prompt Engineering
Embeddings
LaTeX

Raport projektu

Możesz pobrać i przejrzeć kompletny raport projektu ze szczegółową metodologią i wynikami tutaj: Robinson Chatbot - Raport implementacji RAG

Zdjęcia

Chunking Prompty Rozmowa Gotowe prompty Modele