egd-agent

repo for build and eval of the egd agent on various benchmarks

Setup

pip install -r requirements.txt

python runner.py

manual babylm results: Training dataset: babylm (100% of train data) Evaluation dataset: babylm (100% of dev data) Model: gpt2 Evaluation loss: 8.4876 Perplexity: 4854.34 Model size: 81,912,576 parameters
agent only babylm results: Evaluation loss: Perplexity: Model size:
babylm results from egd: Training dataset: babylm (1% of train data) Evaluation dataset: babylm (75% of dev data) Model: gpt2 Evaluation loss: 7.6240 Perplexity: 2046.66 Model size: 64,648,273 parameters
babylm results from egd with agent: Evaluation loss: Perplexity: Model size:

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
4272180233		4272180233
agent		agent
test		test
.DS_Store		.DS_Store
.gitignore		.gitignore
README.md		README.md
agent_memory.db		agent_memory.db
babylm.py		babylm.py
egd_babylm.py		egd_babylm.py
egd_babylm_ray.py		egd_babylm_ray.py
llm_egd_babylm.py		llm_egd_babylm.py
llm_module_generator.py		llm_module_generator.py
requirements.txt		requirements.txt
run.py		run.py