• Privacywetgeving
    Het is bij Helpmij.nl niet toegestaan om persoonsgegevens in een voorbeeld te plaatsen. Alle voorbeelden die persoonsgegevens bevatten zullen zonder opgaaf van reden verwijderd worden. In de vraag zal specifiek vermeld moeten worden dat het om fictieve namen gaat.

Uitschieters uit Spreiding

Status
Niet open voor verdere reacties.

TijdelijkeTom

Gebruiker
Lid geworden
18 okt 2018
Berichten
9
Hallo,
Ik ben bezig met een programma te schrijven voor een ijzerbepaling uit bloed. Dit moeten resultaten worden voor 20 bepalingen over één patientenmonster. De extinctie bepaald wordt met behulp van de spectrofotometer. Alle waarden worden in duplo gemeten. Mijn vraag is hoe kunnen uitschieters berekend worden uit de trendlijn?
Ik hoop dat mijn vraag niet te vaag is en dat iemand van jullie mij kan helpen.

Met vriendelijke groet,
Tom
 
trendlijn, dat veronderstelt een x en een y, met x als tijd en y als meetwaarde ?
Uitschieters dan als buiten +-3s ?
 
Nee, de x-waarde is de concentratie van de standaard van je stamoplossing met ijzer en de y-waarde is de extinctie.
En de uitschieters die ver boven of ver onder de trendtlijn ligt.
 
Is dat niet de variantie in de statistiek?
 
@alphamax, daar ga ik ook van uit, maar met een voorbeeldbestandje kan je dat sneller duidelijk maken, dus daar wacht ik op
 
Excel heeft hier geen makkelijke ingebouwde functie voor, je zal de berekening helemaal op moeten zetten.
Statistische pakketten daarentegen zijn ervoor ontworpen om dit soort regressie analyses (inclusief het detecteren van uitbijters e.d.) uit te voeren. Daarbij helpt het enorm als je (enige) statistische kennis hebt, want als je niet weet wat je aan het doen bent (statistisch gezien) dan is een foutje zo gemaakt.
Er zijn ook on-line diensten die dit doen, kijk bijvoorbeeld eens naar : http://www.quantitativeskills.com/sisa/dataprocs/rdata.htm (geeft helaas geen duidelijke outlier grafiek).
 
Hoe zou je het met de hand uitrekenen, als je het ons kan uitleggen, dan snap je het zelf ook.
Daarna kunnen wij het misschien vertalen naar excel formules.

Dit vind ik een interessante video, zie https://www.youtube.com/watch?v=IX-Na7fn6Zk, zie bijlage voor jouw bestand met de uitleg van de video.
 

Bijlagen

  • worksheet tijdelijketom uitschieters in paren.xlsx
    64,8 KB · Weergaven: 69
Laatst bewerkt:
succes verder toegewenst
 
Mijn vraag is hoe kunnen uitschieters berekend worden uit de trendlijn?
Kun je nog eea toelichten. De techniek die je gebruikt is me compleet duidelijk, daar gaat het niet om.
Een trendlijn schrijf je, welke bedoel je?
Immers je hebt "20 bepalingen over één patientenmonster" verschillende bepalingen.
Ik zie die 20 staan in de tab.
Nu ga je in duplo dat ijzer meten en je krijgt een gemiddelde waarde eruit, ervan uitgaande dat beide waarden niet te ver verschillen van elkaar tov van de bij de methode vereiste nauwkeurigheid, stel 2% max verschil tussen de duplo's?

Of de patient boven jouw trendlijn, dat lijkt me eerder een ijklijn.... ligt...
Over welke trend schrijf je nu?
Aan een duplo van een patient kun je toch geen trend ophangen van deze waarde en de koppelen aan de grafiek?
Je kunt uit de gemeten gemiddelde extinctie wel aflezen wat de gemiddelde waarde v/h ijzer van die patient is, maar daar houdt het imho bij op?
Je kunt wel de patient in de tijd volgen en de trend van zijn/haar ijzerwaarden volgen, maar imho was dat niet jouw vraag.

Kun je dit verder toelichten?
We moeten zuiver zijn in trendlijnen van de gebruikte methode, met een definitie van wat je daar exact mee bedoeld en de trendlijn van de onafhankelijke patiëntmonsters als die een tijd gevolgd wordt?

Zeg het gerust als ik iets verkeerd begrepen heb, kan ook.
 
Zoals gebruikelijk bij analyses meet je niet de grootte van wat je wilt weten, maar een andere grootheid, in dit geval extinctie. Om dus de werkelijke waarde te weten is een ijklijn nodig. Die bepaal je met een serie monsters waarvan je de waarde al kent.
 
Laatst bewerkt:
Kun je dit verder toelichten?

Misschien ben ik niet helemaal duidelijk geweest. Wat ik bedoelde is;
Je wilt de concentratie van, in dit geval, het ijzerconcentratie bepalen van een patiënt. Deze ijzerconcentratie is onbekend. Je maakt met behulp van een stamstandaard verschillende verdunningsreeksen. De stamconcentratie weet je in dit voorbeeld wel, dat is 35,8 mmol/L. Met behulp van verdunningen krijg je verschillende concentraties. Dit ga je meten met behulp van een spectrofotometer en daar krijg je extincties uit. Daarna bepaal je de onbekende concentratie patiëntenmonster. Hier krijg je ook een extinctie uit, en met behulp van je ijklijn (sorry inderdaad ijklijn en geen trendlijn) kan je de concentratie aflezen/berekenen.

Maar stel dat er een student een pipeteerfout maakt bij de verdunningen, hoe kan je deze dan uit je grafiek verwijderen. (Met een afwijking/spreiding van 5%).
Stel dat;
Bij Student 01 (zie voorbeeld) de duplo bij meting 3 een extinctie uitkomt van 0,3668 en 0,3989. Dit is een te hoge spreiding en is iets fout gegaan. Zou dit op een manier aangegeven/automatisch verwijderd kunnen worden in grafiek?

Ik hoop dat het zo duidelijk is als u nog een vraag heeft of er nog onduidelijkheden zijn. Stel ze gerust!
 
Zoals gebruikelijk bij analyses meet je niet de grootte van wat je wilt weten, maar een andere grootheid, in dit geval extinctie. Om dus de werkelijke waarde te weten is een ijklijn nodig. Die bepaal je met een serie monsters waarvan je de waarde al kent.
Ik bedoelde ook een ijklijn en geen trendlijn, mijn excusses
 
Ok, nu wel duidelijk. Meestal zijn medisch analisten of hun leidinggevende (klopt dat?) zeer exact. Dus dit was een nogal verwarrend verhaal.
Dat het om serum ijzer gaat is een bijzaak (mij ega was ooit ook medisch analiste en ik ben zelf chemisch onderlegd, werk als senior in de R&D).
Je kunt minimaal 2 dingen doen...

  • ik zou een conditional format zetten op alle gemeten waarden zodat de cel bijvoorbeeld knal geel oid wordt als de foutengrens overschreden wordt (je zou ook nog tussen 3-5% een waarschuwing (licht oranje) kunnen geven, als een soort early warning... immers er kan een trend ergens door veroorzaakt zijn, who knows..)
  • Je kunt outliers er handmatig uitknikkeren.... niet netjes maar het werkt wel snel...
  • Maar als je iets meer tijd neemt keur de data op de eisen en maak een nieuwe kolom obv een fouten berekening of het voldoet aan DE criteria. NOK, dan wordt de waarde in de nieuwe kolom niet opgenomen (er komt #N/A te staan..) en de aangepaste ijklijn wordt netjes gemaakt.
    Ik vind onderstaande aanpak dus wel netjes. Het is maar een voorbeeld.
    Je zou die conditional format ook kunnen combineren met de laatste optie, want wegpoetsen is een ding, bewustwording dat er mogelijk iets met bijv het door jou genoemde pipetteren is een andere. Dus die waarschuwing voegt wat toe bovenop de bepaling zelf en het juist zijn van de ijklijn.

https://www.exceldashboardtemplates...-statistical-outliers-in-an-excel-line-chart/

Maar er is veel meer in the out side world, kijk zelf of je dat beter bevalt dan mijn suggestie.
 
Laatst bewerkt:
Ik ben geen medicus of chemicus.
Maar moet je niet alle outliers er zelf handmatig uithalen in plaats dit te laten doen door een formule.
De grafieken geven een idee van de outliers, maar als de outlier past in het patroon van de data ervoor en erna (stijgende lijn, dalende lijn).
Dan kan het toch ook zijn dat een outlier toch geaccepteerd wordt, of heb ik het mis?
 
Deze manier maakt 2 kolommen.... dus je kunt zowel de originele als de aanpaste data plotten... zie artikel, daar doen ze het ook.
Ik ben er zelfs een voorstander van omdat automatisch te rapporteren dat het niet aan de aandacht ontsnapt.
Vandaar de combi met de conditonal format ... laat de cel met die data maar van kleur veranderen... dat valt goed op.
Niks onder het tapijt futselen...

Technisch gesproken: als je een ijklijn hebt en alles behalve 1 punt ligt netjes op een lijn met een hoge nauwkeurigheid, dan moet je nog steeds scherp blijven ivm met de oorzaak, maar de kans dat er iets als pipetteren mis gegaan is, kan prima.
ALS dat vaker voorkomt, e mss zo wie so... dan zou ik een dosimat (bijv van Mettler) overwegen, die zijn super nauwkeurig en de top unit zijn verwisselbaar, dus je kunt ook andere vloeistoffen doseren. Via het menu op de dosimat of via een programma op een gekoppelde PC kun je kiezen wel doseer programma gebruikt wordt.

Pipetteren met de hand, risico op cross contaminatie, ik zou het niet zo snel meer doen. Er zijn zoveel betere methodes, niet gratis, maar je kunt ook veel sneller werken, dus het verdient zich ook terug, immers al die bepalingen hebben hun tarief en dat betalen we als de huisarts dit aanvraagt...

Mijn collega houdt dat spul bij en dat kan prima werken.

Daarnaast: Houd goed bij wanneer iets mis gaat. KAN een signaal zijn voor een foutenbron die je absoluut niet wilt...

Ik zit zelf nu in R&D van polymeren, maar dit heb ik aan de basis allemaal wel geleerd.
Ipv een aparte ijklijn maken zou je ook een standaardadditiemethode kunnen gebuiken.
https://nl.wikipedia.org/wiki/Standaardadditiemethode
Vooral bij monsters waar de matrix een enorme invloed kan hebben kan dat betrouwbaarder zijn.

Waarschijnlijk meten jullie nog veel meer monsters nadat de ijklijn gemeten is?
En dan de serie van de patiënten.

Toch nog een paar uitdagende vragen....tav validatie/betrouwbaarheid:
1. Meten jullie tussendoor nog standaarden met een random plaats in de serie?
2. Meet je de ijklijn aan het einde van alles nog een keer? Extra controle om drift of iets anders v/h systeem/de hele opzet te checken?
 
Er zijn gevalideerde methoden om uitschieters te bepalen bij het fitten van een rechte lijn door een reeks metingen, daar hoeft geen giswerk aan te pas te komen, alleen de juiste software en enige statistische kennis.
 
Status
Niet open voor verdere reacties.
Steun Ons

Nieuwste berichten

Terug
Bovenaan Onderaan