TIBCO Statistica 13.5
Definice chybějících dat pro práci ve vzorcích nad tabulkou (DŮLEŽITÉ)
Práce s chybějícími daty (MD = chybějící data, prázdné buňky) ve vzorcích nad tabulkou se změnila. Chcete-li se vrátit k předchozí verzi před 13.5, zvolte volbu Home -> Options -> Spreadsheets -> Use legacy MD comparisons in formulas. Po změně této volby ukončete a restartujte program Statistica.
Spotfire Integration – více možností parametrizace
Analytické postupy v softwaru Spotfire, fungující zejména jako grafická nadstavba nad softwarem Statistica, můžete nyní parametrizovat přímo z workspace programu Statistica. Když uživatel programu Statistica definuje ve workspaces novou funkci, zapíší se vstupní a výstupní parametry této funkce do tzv. nodu a Spotfire je schopný se do tohoto nodu připojit a vstupní i výstupní parametry této funkce využít.
To dává analytikům větší kontrolu nad nastavením analýzy. Také je možné snížit množství parametrů z workspace programu Statistica, které se následně budou zobrazovat ve Spotfire Analyst. Při úpravě workspace v rámci programu Statistica vyberte tlačítko Designer view. Můžete vybrat specifické nody nebo zrušit výběr sdílených nodů a i parametrů v rámci nodu.
Doporučujeme podívat se na video.
Spotfire Integration – prvek Reporting Documents
Prvek Reporting Documents v rámci workspace programu Statistica nemohl být použit před verzí 13.5. Nyní budou všechny vygenerované a uložené tabulkové typy dokumentů (tabulky) v prvku Reporting Documents použitelné ve Spotfire Data Function.
Spotfire Integration – sdílení s dalšími analytiky Spotfire
… zavolání workspace programu Statistica (bez kódované analytiky) pomocí Spotfire Data Function
… vložení workspace programu Statistica do souboru Spotfire.dxp a sdílení s dalšími analytiky Spotfire
Nyní je možné nainstalovat program Statistica na stejném počítači pomocí nástroje Spotfire Analyst. Spotfire X potřebuje mít nainstalován balík Statistica Extension.
Poznámka: Dashboard Spotfire může být vytvořen pouze lokálně pomocí Spotfire Analyst. Je to výhodné pro Ad-hoc analysis, Exploring, Model Building, Feature Selection. Tato funkcionalita nemůže být používána uživatelem nástroje Spotfire Consumer.
Variable Selection
Když pracujete s velkými datovými sadami a s výběrem dlouhých složitých seznamů proměnných pro analýzy s různými kategoriemi proměnných (příklad: závislé, kategorické, kontinuální), pokud se některé proměnné v těchto seznamech překrývají, je těžké určit, které proměnné to jsou a opravit je. Chybové hlášení o překryvu proměnných bylo vylepšeno. Uvádí, které proměnné se překrývají. A nabízí následující tři možnosti:
- odstranění duplikátů z prvního seznamu
- odstranění duplikátů z druhého seznamu
- manuální úprava výběrů proměnných
Tato funkce snižuje čas strávený výběrem proměnných v interaktivních modulech a prvcích workspace.
Workspace
Prvek Alternative Least Squares Deployment
Prvek Alternative Least Squares Deployment byl aktualizován.
Po výběru tlačítka Deploy to Enterprise může uživatel nyní vybrat místo možnosti Deploy to Enterprise novou možnost None.
Customize Output pro Workspace
Funkce Customize Output se většinou běžně používá k nastavení počtu desetinných míst pro statistiku, tučně označený text nebo formát grafiky. Tato funkce je přístupná klepnutím pravým tlačítkem na libovolný prvek ve workspace. Zobrazí se vám nabídka pro výběr a otevření dialogového okna Customize Options.
Byla přidána nová možnost k zatrhnutí Suppress output. To umožňuje designerovi workspace se rozhodnout, který výstupní prvek se zobrazí v nodu Reporting Documents. Všechny grafy ze všech prvků nebo konkrétních prvků mohou být potlačeny. Všechny výstupy tabulek (tabulky) lze potlačit pro všechny prvky nebo konkrétní prvky. Jednotlivé grafy nebo tabulky lze také potlačit.
Tato funkce poskytuje detailní kontrolu nad tím, co uživatel ve workspace vidí.
Prvek Data Health Check
Do prvku Kontrola stavu dat bylo přidán políčko použití předchozího popisu. Bylo to přidáno, aby to pomohlo vytvořit šablonu. Například to může být kombinováno s novým prvkem Select Predictors.
Prvek Elasticsearch Text Analytics
Na kartě Specifications -> Quick, vyberte Files. Zkontrolujte dialogové okno Procházet složku. Vybraný adresář se nyní zobrazí v tomto dialogovém okně.
Prvek Filter and Process Data
Filter Duplicate Cases, Filter Sparse Data, MD Imputation, Process Invariant Variables, Process MD and Rank nodes nyní podporují zástupné znaky při výběru proměnných. Výběr proměnných je důležitý pro vytváření šablon, které lze znovu použít. Jiné prvky již tuto funkci mají.
Například může být zvolena proměnná:
*KOČKA*
1 *
*A
Obecný lineární (GLM) prvek
Obecný lineární (GLM) prvek je ověřen a uvolněn ve verzi 13.5. Bylo to vydáno jako „beta“ v předchozích vydáních.
Prvky ITrees CHAID
Volba Always split on minimum p je přidána do prvků ITrees CHAID Classsification and Regression.
Prvek K-Means Clustering
Prvek K-Means Clustering je ověřen a uvolněn ve verzi 13.5. Bylo to vydáno jako „beta“ verze v předchozích vydáních.
Prvek Lasso Regression
Použití předchozího vstupního popisu bylo přidáno do prvku Lasso Regression. Bylo to přidáno, aby to pomohlo vytvořit šablonu. Například to může být kombinováno s novým prvkem Select Predictors.
Prvek Normality tests
Prvek Normality tests vypočítává testy normálnosti (Kolmogorov-Smirnov test statistic, Kolmogorov-Smirnov p-value, Lilliefors p-value, Anderson-Darling test statistic, Anderson-Darling p-value, Shapiro-Wilks p-value) pro každou proměnnou. Pokud jsou vybrány dvě nebo více proměnných, můžete vypočítat následující testy vícerozměrných normálností:
- Mardia’s test of multivariate skewness
- Mardia’s test of multivariate kurtosis
Proč testovat normálnost? Normální distribuce je základem mnoha algoritmů. A ověření normality datového souboru může být rozhodující pro získání správného výsledku analýzy. Ověřením lze považovat výběr za vhodný pro algoritmy, které mají potvrdit hypotézu.
Například: „Nemám rád průměr. Mám rád individualitu. Jeden člověk může mít šest jídel během den a někdo jiný ani jedno. Neznamená to, že by oba měli průměrně tři jídla během dne a byly najedení.“ ~ Louis D. Brandeis, Spřízněný soudce Nejvyššího soudu Spojených států v letech 1916 až 1939
Prvek PI
Řízení kalendáře se přidává do polí startu času a ukončení času všech prvků PI.
Prvek Reporting Tables
Nyní můžete změnit uspořádání prvků v poli Placement group box v prvku Reporting Tables.
Prvek nyní generuje datový soubor pro další analýzu. Před verzí 13.5 byla tato možnost ve výchozím nastavení vypnutá.
Prvek Select Predictors
Prvek Select Predictors se připojí k jedinému zdroji dat. To může být velmi užitečné se Spotfire Integration. Uživatel může vybrat jednu cílovou proměnnou pro problémy s prediktivní analýzou. Prvek klasifikuje a vybírá zbývající proměnné jako kontinuální nebo kategorické prediktory. Poté prochází výběrem proměnných jednu po druhé.
Připojte prvek Select Predictors node to Advanced Classification Trees (C&RT), Advanced Regression Trees (C&RT), Advanced Classification CHAID, Advanced Regression CHAID, Boosted Trees, Data Health Check, K-Nearest Neighbors, Lasso Regression, Feature Selection, MARSplines, Random Forest, SANN Classification, SANN Clustering, SANN Regression, Support Vector Machines and SVB, který používají výběr závislé / predikované proměnné.