Rethinking Evaluation for LLM Hallucination Detection: A Desiderata, A New RAG-based Benchmark, New Insights
cz 1小时前
cz 1小时前
前康 5天前
hhx 1周前 (05-11)
hhx 1周前 (05-09)
cz 1周前 (05-08)
hhx 3周前 (04-28)
杨, 宗霖 3周前 (04-26)
杨, 宗霖 3周前 (04-26)
cz 4周前 (04-22)
前康 4周前 (04-20)