wtyczka , mechanizm captcha dla bielik llm
- Google pokazywał użytkownikom fragmenty zdjęć z Google Street View.
- Użytkownicy mieli kliknąć „gdzie jest sygnalizator / przejście dla pieszych / autobus”.
- Użytkownicy wykonywali w tle darmową etykietyzację zdjęć, którą Google wykorzystywał do trenowania swoich systemów wizji komputerowej (np. rozpoznawania ulic).
Warto zrobić dokładnie to samo, tylko:
- zamiast zdjęć Google Street View → zdjęcia z projektu Obywatel Bielik,
- zamiast modelu Google → Bielik Vision,
- zamiast milionów użytkowników Google → użytkownicy internetu rozwiązujący CAPTCHA na tysiącach stron,
- które używają Twojej wtyczki ochronnej.
pozwala to: ✔ szkolić model Bielik Vision prawdziwymi danymi kulturowymi, ✔ zwiększać zaangażowanie społeczności, ✔ poprawiać jakość opisów zdjęć, ✔ budować unikalny polski odpowiednik reCAPTCHA, ✔ finansować rozwój poprzez SaaS (bez dotacji).
Polski odpowiednik reCAPTCHA, który jednocześnie chroni strony i etykietyzuje zdjęcia z Obywatela Bielika.
np. formularz kontaktowy, koszyk zakupowy, logowanie.
np. stare zdjęcie rodzinne, zdjęcie obrzędu, starego budynku, sytuacji społecznej, archiwalne fotografie.
- „Zaznacz zdjęcie, na którym widać osobę.”
- „Wskaż element związany z polską kulturą.”
- „Które zdjęcie przedstawia budynek?”
- „Czy na zdjęciu znajduje się kobieta?”
- „Jakiego typu jest to miejsce? (dom / kościół / ulica / targ)”
W praktyce użytkownicy w całej Polsce (a nawet na świecie) będą robić za:
- anotatorów,
- klasyfikatorów obrazów,
- weryfikatorów opisów.
To daje setki tysięcy opisów dziennie bez płacenia za labeling.
- zdjęcia z portalu są automatycznie opisywane przez masy użytkowników.
- model wizualny jest trenowany szybciej i taniej niż w klasycznym procesie ML.
- powstaje unikalna baza opisów kulturowych z perspektywy Polaków.
- boty odpadają
- użytkownik potwierdza człowieczeństwo
- a Ty zdobywasz dodatkowe dane opisowe o zdjęciach
- bo ludzie pomagają mimochodem
- nawet jeśli nigdy nie słyszeli o projekcie
- rejestruje się w formularzu
- pobiera losowe zdjęcie z publicznej puli projektu
- generuje pytanie (przez API Bielik)
- użytkownik odpowiada
- odpowiedź trafia jako anotacja do systemu
- formularz jest przepuszczany/odrzucany przez mechanizm scoringu
- Czy na zdjęciu są ludzie?
- Ile osób?
- Mężczyzna / kobieta?
- Dziecko / dorosły?
- Tradycja / święto / wydarzenie lokalne
- Strój ludowy / współczesny
- Region Polski (jeśli oczywiste)
- Rodzaj miejsca (dom / wieś / miasto / kościół)
- Okres (np. lata 60., PRL, międzywojnie)
- Czy zdjęcie ma charakter archiwalny?
- zwierzęta, pojazdy, narzędzia, budynki…
Jednocześnie ta infrastruktura trenuje Bielika — więc każdy klient SaaS zasila rozwój AI.
- ŻADNA firma na świecie nie robi polskiej CAPTCHA kulturowej.
- Zdjęcia z projektu Obywatel Bielik idealnie nadają się do crowdsourcingu.
- Duże portale, sklepy i urzędy preferują polskie rozwiązania (RODO, suwerenność danych).
- Można stworzyć produkt publiczny / obywatelski wspierany przez instytucje.