Hoppa till innehållet

Riktlinjer för proteindata

Riktlinjer för Covid-19-data

Gör dina Covid-19-forskningsdata användbara och tillgängliga för resten av forskarvärlden genom att publicera data och tillhörande metadata i en öppen databas.

SciLifeLab och NBIS kan hjälpa dig med att i början av projektet planera datahanteringen för att effektivisera datadelning, både genom konsultationer och genom att tillhandahålla ett verktyg för att skapa datahanteringsplaner. Vi kan också hjälpa dig att identifiera relevanta repositorier och etablerade internationella standarder för att beskriva och publicera dina data, samt vägleda dig genom publiceringsprocessen.

Repositorier

Uniprot är en av de viktigaste databaserna för proteinsekvenser. Proteinfamiljer lagras i Pfam och strukturer i PDBe.

Se FAIRsharing med sökterm ‘proteomics’ för en granskad lista över relevanta repositorier för proteomikdata.

Vi rekommenderar att använda repositoriet PRIDE, som tillhandahålls av ProteomeXchange Consortium. Repositoriet tar emot protein- och peptiddata, med tillhörande masspektra och övriga, relaterade, datatyper.

Metadata

Metadata innebär ‘data om data’ och kan innehålla information om metod som används för att samla in data, analytisk och procedurell information, definitioner av variabler, mätenheter, eventuella antaganden, format och filtyp för datamaterialet och programvara som används för att samla in och / eller bearbeta data. Forskare rekommenderas starkt att använda etablerade metadatastandarder där dessa finns.

För proteomikdata är MIAPE en lämplig metadatastandard att använda. Beskriv din metadata genom att använda vokabulärer från Proteomics Standards Initiative: PSI CVs.

Det rekommenderas starkt att redan från början av projektet strukturera t.ex. metadata på ett sätt som möjliggör publicering av sekvensdata utan att behöva strukturera om metadata.