O documento discute a importância da proveniência de dados em projetos de bioinformática, definindo proveniência como a origem dos dados. Ele introduz o modelo PROV-DM para representar a proveniência como um grafo com atividades, entidades, agentes e coleções como nós e relações como arestas. Finalmente, discute resultados atuais e possíveis trabalhos futuros, incluindo disponibilização na web e uso de bancos de dados gráficos.