pip install -r requirements.txt
python -m uvicorn api:app --reload --host 0.0.0.0 --port 8000
cd site/raia
npm install
npm run dev
!python -m spacy download pt_core_news_sm
Utilizamos a API atproto da bluesky para obtermos postagens reais, além de obtermos informações relevantes sobre o autor e os posts, que incluem: Quando a conta foi criada, qual o ratio de seguidores/seguindo e quais posts foram postados por mais de um usuário, indicando coordenação.
Utilizamos o fake-br-corpus, que contém notícias rotuladas como verdadeiras ou falsas. O treinamento é feito com cross validation: dividimos os dados em k partes, treinamos em k-1 e validamos na parte restante, repetindo até usar todas as partições. Assim, o modelo aprende padrões linguísticos que distinguem fake news de notícias reais e gera métricas médias (acurácia, F1, etc.) que indicam seu desempenho.
A LLM atua como um terceiro pilar, complementando os sinais de usuários e padrões textuais. Ela recebe o conteúdo suspeito e aplica checagem de fatos automática, além de receber as informações do modelo anterior e os metadados da conta. Assim, a decisão final é mais robusta, e a chance de alucinação é menor.
Transformamos a checagem de fatos em uma API, que nos permite exibir de maneira clara: cada post, a avaliação de veracidade e o motivo da análise (por que foi considerado confiável ou suspeito).