科技改變生活 · 科技引領未來
不知道你有沒有發現,黑色背景+橙色文字的logo越來越多,無論你刷B站、微博、抖音,這種略帶西方神秘主義的圖像總讓人微微一笑。
直男吸鐵石半佛老師引人入勝的視頻封面
當然,作為陽光向上的SAS程序員,我們更多的時間當然是在寬敞的工位上瀟灑地編程。有時領導悄悄走過你的身邊,拍拍你的肩膀跟你說:現在這個study的數據你拿Pinnacle 21跑一下。
不知道Pinnacle 21是啥的你,默默打開搜索引擎,卻發現了一個讓人羞澀又心動的頭像。
不開玩笑,這真是Pinnacle 21在linkedIn上的官方頭像,不是PxxxHub 21+的縮寫。
如果你沒聽過Pinnacle 21這個工具,我們先來介紹一下它的地位。在醫藥公司和CRO里,SAS程序員打開次數最多的軟件一定是SAS,第二名就可能是Pinnacle 21。
那么這個神奇的軟件是怎么來的呢?Pinnacle 21是一家2011年成立的公司,如果說醫藥行業是一座金礦,那么藥廠就是在這座金礦的掘金者,眾多CRO就是為掘金者送外賣的小哥,但Pinnacle 21公司相當于是賣鏟子和牛仔褲的商販。
Pinnacle 21在2016年前,它們開發的產品不叫這個名字,而是一個更通俗易懂的名稱:OpenCDISC。
然而,強大的CDISC組織可不希望這家公司打著自己的名號四處招攬用戶,于是要求產品改名,公司于是將產品名稱改成了這個略帶中二的感覺:巔峰21。
Pinnacle 21的界面極其簡單,主要功能有兩個:檢測CDISC數據和創建define文件。這篇文章我們來講講用Pinnacle 21的第一個功能。
實現這個功能有多簡單呢?總共分三步:把數據集放進去、點擊運行按鈕、把結果文檔打開。
Pinnacle 21無法接受SAS數據集,我們需要先把數據轉化為xpt文件,然后讀取到Pinnacle 21之中。
在點擊Validate按鈕之前,你還可以選擇所用的CDISC版本,Control Term的版本等等,確認所有需要檢測的數據都上傳成功后就可以點擊Validate按鈕等待它產生結果了。
在運行幾秒到幾十秒后,程序會顯示生成了一個Excel文件,現在我們打開它:
放大來看,這個文件總共有5張表,分別是Validation Summary 、Dataset Summary、 Issue Summary 、Details 、Rules。我們需要注意的是其中的三個表格:
Dataset Summary-這個表中顯示被檢查的每個數據集名稱和錯誤類型的數量,我們需要根據這些信息確定哪些數據中有錯誤。
Issue Summary-如果你想了解每個數據中的具體錯誤類型,就需要進入Issue Summary這個表。它顯示了每個數據集里各種錯誤的描述和數量。
Details-如果你想了解哪條數據有錯誤,如何定位它們,就需要進入Details表進行查看。
說到這里,我們可以發現,三個重要的表是一個層層遞進的過程。下面我們用一個具體的數據集來了解一下通過Pinnacle 21如何找出數據集的錯誤。
進入Dataset Summary表,發現ADEG數據集看上去一切完美,沒有任何Reject。可事實是這樣嗎?
不要高興太早,我們進入Issue Summary表,發現ADEG下有三條記錄。
第一條記錄說明有變量的label與CDISC標準不相同,第二條記錄說明COMPFL的值有問題,應該是Y或空,第三條則是ABLFL=Y的記錄中base不等于AVAL。這三個問題明顯是都不符合CDISC標準,那么我們如何知道究竟是哪條記錄有這種錯誤呢?請打開第三個表Details。
我們可以看到,Details表中包含了更多的數據,從這些數據里我們可以得出以下信息:
1. 變量ADTM的label不正確
2. 變量COMPFL的值存在N,應該改為缺失值
3. 很多記錄的基準線值里base為缺失值而非AVAL
有了以上這些信息,我們就可以明確地修改數據集。
這就是Pinnacle 21這個軟件的重要功能之一,即讓我們可以快速地找出數據集與CDISC標準相左之處。如果說SAS程序員是一個游戲高手,那么Pinnacle 21就相當于開圖外掛,你不需要對著CDISC標準一個變量一個記錄地看,用Pinnacle 21直接完成全圖掃描,然后告訴你敵人在哪里。
當然,以上只是Pinnacle 21軟件的一個功能,它的另一個重要功能——創建define文件,我們將在后續逐步分享。
王熙明