We're sorry but this page doesn't work properly without JavaScript enabled. Please enable it to continue.
Feedback

Top 15 Python Tips for Data Cleaning/ Understanding

00:00

Formale Metadaten

Titel
Top 15 Python Tips for Data Cleaning/ Understanding
Untertitel
With two bonus tips!
Serientitel
Anzahl der Teile
130
Autor
Lizenz
CC-Namensnennung - keine kommerzielle Nutzung - Weitergabe unter gleichen Bedingungen 3.0 Unported:
Sie dürfen das Werk bzw. den Inhalt zu jedem legalen und nicht-kommerziellen Zweck nutzen, verändern und in unveränderter oder veränderter Form vervielfältigen, verbreiten und öffentlich zugänglich machen, sofern Sie den Namen des Autors/Rechteinhabers in der von ihm festgelegten Weise nennen und das Werk bzw. diesen Inhalt auch in veränderter Form nur unter den Bedingungen dieser Lizenz weitergeben
Identifikatoren
Herausgeber
Erscheinungsjahr
Sprache

Inhaltliche Metadaten

Fachgebiet
Genre
Abstract
Data cleaning is one of the most important tasks in data science but it is unglamorous, underappreciated and under-discussed. These are some common tasks involved in data cleaning but not limited to: - Merging/ appending - Checking completeness of data - Checking of valid values - De-duplication - Handling of missing values - Recoding Most, if not all, of the time, the datasets that we have to analyze are unclean. i.e. they are not necessarily complete/ accurate/ valid. This will impact the accuracy of our analysis if we do not clean them properly. This talk covers how to perform data cleaning and understanding using primarily Pandas and Numpy. If you’re new to data analytics/ data science and are interested how to use Python to perform analysis, or if you're an Excel user hoping to move to Python, this talk might be for you. Participants should be at least familiar with the basics of Python programming.
Güte der AnpassungComputeranimationBesprechung/Interview
Architektur <Informatik>CodecWeb logMessage sequence chartStatistikTaskSpannweite <Stochastik>GleitkommarechnungUmsetzung <Informatik>ZeichenketteSchlussregelDistributionenraumProzess <Informatik>Notebook-ComputerFokalpunktTermHypermediaZeichenketteZählenTaskBitGanze ZahlVariableKontextbezogenes SystemPhysikalisches SystemDifferenteReelle ZahlSpannweite <Stochastik>GrenzschichtablösungRechter WinkelAnalytische MengeMAPEin-AusgabeGebäude <Mathematik>StatistikKategorie <Mathematik>DatentypTransformation <Mathematik>ComputerarchitekturProdukt <Mathematik>PufferüberlaufSchnittmengeEindeutigkeitGemeinsamer SpeicherMultiplikationsoperatorProgrammbibliothekDatensatzEndliche ModelltheorieNegative ZahlWeb logCodeElektronischer ProgrammführerFrequenzCoprozessorCodecProjektive EbeneGrundraumOverlay-NetzDateiformatKeller <Informatik>Data-Warehouse-KonzeptAbfrageDämpfungCASE <Informatik>Nichtlinearer OperatorGeschlecht <Mathematik>Spider <Programm>Framework <Informatik>OrtsoperatorComputeranimation
VariableSpannweite <Stochastik>TaskSystemidentifikationÄhnlichkeitsgeometrieEin-AusgabeMetrisches SystemBeobachtungsstudieQuellcodeDateiformatRechenschieberNotebook-ComputerRechter WinkelLesen <Datenverarbeitung>TabellenkalkulationCASE <Informatik>DifferenteMaterialisation <Physik>AnalysisVorzeichen <Mathematik>ProgrammbibliothekTransaktionVariableWiderspruchsfreiheitVerschlingungDatentypDatenbankQuellcodeMultiplikationsoperatorDatenfeldDatenstrukturRechter WinkelCodecSchlüsselverwaltungDatensatzEndliche ModelltheorieSchnittmengeAlgorithmusTermZeichenketteMatrizenrechnungInformationResultanteSystemplattformSpiegelung <Mathematik>Projektive EbeneGoogolDateiformatBenutzerbeteiligungÄhnlichkeitsgeometrieTaskKontextbezogenes SystemBitVollständiger VerbandStrömungsrichtungSchießverfahrenObjekt <Kategorie>Ganze ZahlTransformation <Mathematik>MathematikDämpfungArray <Informatik>BildschirmmaskeStörungstheorieTeilbarkeitXMLComputeranimation
SymboltabelleEin-AusgabeRechenwerkPrimzahlzwillingeCAN-BusProdukt <Mathematik>MenütechnikGleitkommarechnungLokales MinimumBinärdatenVerschlingungPetri-NetzKette <Mathematik>Konvexe HülleMetropolitan area networkKardinalzahlFunktion <Mathematik>Gemeinsamer SpeicherRechenwerkHoaxNatürliche ZahlMAPFunktionalCodeSchlüsselverwaltungBitYouTubeGeradeDateiformatZählenDatensatzTotal <Mathematik>FacebookGruppenoperationMereologieDifferenteRechenschieberSchnittmengeFehlermeldungVariableBildschirmmaskeEin-AusgabeDistributionenraumÄhnlichkeitsgeometrieDifferenzkernZahlenbereichNeuroinformatikShape <Informatik>TermProzess <Informatik>Inelastischer StoßSymboltabelleInstallation <Informatik>ZeichenketteDefaultArithmetisches MittelGarbentheorieTaskKorrelationNotebook-ComputerRechter WinkelCASE <Informatik>Software Development KitKnotenmengeCoxeter-GruppeKugelkappeSystemplattformKorrelationsfunktionQuick-SortMatrizenrechnungTopologieWechselsprungXML
CodecVerschlingungFacebookWeb logComputeranimationBesprechung/Interview
Transkript: Englisch(automatisch erzeugt)