Data Scientist - Statistica.pro - Uznávaný statistický software v češtině

Výkonný balíček pro zpracování rozsáhlých datových projektů za pomoci nástrojů ETL, AI a strojového učení.
Možnost nezávislého nasazení vytvořených procesů a modelů do aplikací třetích stran.

Verzi Data Scientist aplikace Statistica využijete především k analýze velkých (big data) souborů, k tvorbě pokročilých prediktivních modelů a pro jiné komplexní datové projekty. Součástí balíčku je řada nástrojů strojového učení, AI a ETL.

Verzi Data Scientist využijí především datoví vědci a analytici pro predikci a modelování chování proměnných za různých podmínek a import vytvořených modelů a procesů do aplikací třetích stran.

Software je k dispozici ve stolní, síťové i serverové formě.

Bez nutnosti zadávat platební údaje

Import dat

Data Scientist je plně kompatibilní se soubory xlsx (včetně xls), csv a s daty s pevnou šířkou (např. v textových souborech). Umožní vám:

načítat data z SQL, NoSQL a dalších databází,
pomocí integrovaného PI konektoru načíst data z OSIsoft PI systému (oblíbené řešení pro správu provozních dat),
importovat Spotfire SBDF datové soubory,
integrovat dva a více datových setů do jednoho grafického prostředí a série výstupů.

Příprava dat

Data Scientist nabízí automatizované očištění dat od duplicitních, nekonzistentních a odlehlých hodnot (popř. jejich překódování) pomocí tzv. Data Health Check (DHC) funkce.

Pro pokročilou datovou transformaci slouží nástroj Rules Builder, který vám umožní data z různých zdrojů zpracovat podle komplexních pravidel (i s využitím podmiňovacích výrazů).

Pro snazší zpracování přiblížíte svá data k normálnímu rozložení využitím zabudované Box-Coxovy transformace.

Vyhodnocení dat

Ve verzi Data Scientist vyhodnotíte naměřená data (včetně big data souborů) mj. pomocí:

klasických metod popisné, parametrické a neparametrické statistiky,
explorační analýzy a vizualizace,
vícerozměrných statistických metod pro organizaci a klasifikaci dat,

pokročilých lineárních a nelineárních modelů,

odhadu mnoha složek rozptylu a přesnosti v datových souborech (Variance Estimation and Precision).

Prediktivní modelování

V aplikaci vytvoříte s pomocí nástrojů data miningu, text miningu a neuronových sítí modely chování sledovaných proměnných v různých situacích.

Modely je možné vygenerovat v jazycích C, C++, C#, Java, PMML, SAS a SQL a dále upravovat podle potřeby.

Data Scientist nabízí např. také funkce rozhodovacích stromů a náhodných lesů a možnost optimalizace prediktorů.

Další funkce

Statistica v této verzi nabízí také možnost naprogramovat si vlastní skripty v jazycích R, Python či C#. Balíček Data Scientist dále využijete např. pro:

porozumění klíčovým parametrům ovlivňujícím kritické atributy kvality (funkce procesní analýzy, kontroly kvality a vícerozměrného statistického řízení procesů),
návrh experimentů a jejich virtuální provádění (funkce designování experimentů – Design of Experiments, analýza síly testu – Power Analysis a odhad intervalu – Interval Estimation),
nasazení vytvořených procesů a modelů do aplikací třetích stran (s autonomní funkčností nezávislou na TIBCO Statistica).

Vizualizace a výstupy

Rozložení získaných dat a výsledky zobrazíte ve verzi Data Scientist mj. prostřednictvím histogramu, přímek, krabicových, bodových, rozptylových a kvantilových grafů a dalších často využívaných metod 2D i 3D zobrazení.

Získané výsledky může vyexportovat např. v podobě:

jednoduchých i pokročilých reportů,
zápisu do různých typů databází,
souborů MS Word (docx), MS Excel (xlsx) a textových souborů (csv), či pdf.

Přehled analytických funkcí

ANOVA/MANOVA
Association Rules
Automated Neural Networks
Boosted Tree
Calculators; Distributions, Pearson Product Moment Correlation Coefficient, Six Sigma
Canonical Analysis
Classification Trees
Cluster Analysis
Correlation
Correspondence Analysis
Cox Proportional Hazards Models
Data Miner Recipes
Descriptive Statistics
Design of Experiments (DOE)
Discriminant Function Analysis
Distribution Fitting
Distributions & Simulation
Dynamic Time Warping
Extract, Transform, and Load (analytics are used to align time based data)
Factor Analysis
Faster Independent Component Analysis
Feature Selection
Fixed Nonlinear Regression
General CHAID Models
General Classification and Regression Trees (C&RT)
General Discriminant Analysis (GDA)
General Linear Models (GLM)
General Partial Least Squares Models (PLS)
General Regression Models (GRM)
Generalized Additive Models (GAM)
Generalized Linear/Nonlinear Models (GLZ)
Generates Predictive Models in C, C++, C#, Java, PMML, SAS, SQL Stored Procedure in C#, SQL User Defined Function in C#, Statistica Visual Basic
Goodness of Fit, Classification, Prediction
Independent Component Analysis
Interactive Tree (C&RT, CHAID)
Lasso Regression
Link Analysis
Log-Linear Analysis of Frequency Tables
Machine Learning (Bayesian, Support Vectors, K-Nearest)
Multidimensional Scaling (MDS) 
Multivariate Adaptive Regression Splines (MARSplines)
Multiple Regression
Nonlinear Estimation
Nonparametric Statistics
Power Analysis and Interval Estimation
Multivariate Statistical Process Control (MSPC – PCA / PLS)
Optimal Binning
Predictor Screening
Principal Components & Classification Analysis (PCCA)
Process Analysis
Process Optimization
Quality Control Charts
Random Forests
Rapid Deployment of Predictive Models (PMML)
Reliability and Item Analysis
Sequence and Link Analysis
Stabilty and Shelf Life Analysis (regulated by FDA)
Stepwise Model Builder (what-if)
Structural Equation Modeling and Path Analysis (SEPATH)
Survival & Failure Time Analysis
Time series / forecasting
t-tests and other tests of group differences
Tabulate
Text Mining
Variance Components & Mixed Model ANOVA/ANCOVA
Weight of Evidence

TIBCO Statistica Data Scientist

Import dat

Příprava dat

Vyhodnocení dat

Prediktivní modelování

Další funkce

Vizualizace a výstupy

Přehled analytických funkcí

Další produkty

Desktop

Analyst

Modeler

Comprehensive

Chcete se s námi poradit?

Kontaktní formulář

Užitečné odkazy

Užitečné kontakty

TIBCO Statistica Data Scientist

Import dat

Příprava dat

Vyhodnocení dat

Prediktivní modelování

Další funkce

Vizualizace a výstupy

Přehled analytických funkcí​

Další produkty

Desktop

Analyst

Modeler

Comprehensive

Chcete se s námi poradit?

Kontaktní formulář

Užitečné odkazy

Užitečné kontakty

Přehled analytických funkcí