FlagEval

All

6 repositories

FlagEvalMM
Public
A Flexible Framework for Comprehensive Multimodal Model Evaluation
Python
•4•54•0•0•Updated Dec 19, 2024Dec 19, 2024
.github
Public
0•0•0•0•Updated Nov 8, 2024Nov 8, 2024
HalluDial
Public
Python
•1•15•1•0•Updated Aug 19, 2024Aug 19, 2024
FlagEval_Report
Public
CSS
•0•0•0•0•Updated Jul 18, 2024Jul 18, 2024
FlagEval
Public
FlagEval is an evaluation toolkit for AI large foundation models.
Python
•
Apache License 2.0
•27•311•4•2•Updated Jul 13, 2024Jul 13, 2024
CMMU
Public
[IJCAI 2024] CMMU: A Benchmark for Chinese Multi-modal Multi-type Question Understanding and Reasoning
Python
•0•23•0•0•Updated Feb 1, 2024Feb 1, 2024