少し関係していると思うので、気を付けるようにします。
書き換え可能のデータ受領=大学側ずさん管理で元社員—ノバルティス不正・東京地検(ウォールストリートジャーナル)
2014 年 6 月 12 日 06:30 JST 更新
製薬大手ノバルティスファーマの高血圧治療薬ディオバン(一般名バルサルタン)の臨床研究データ不正操作事件で、薬事法違反(誇大広告)容疑で逮捕された白橋伸雄容疑者(63)が、京都府立医大の臨床試験データを書き換え可能な状態で、神戸市のデータ管理会社から受け取っていたことが12日、関係者への取材で分かった。同大の臨床研究計画では、データを変更できないようにして解析者に渡すと決めておらず、データ管理のずさんさが不正につながった可能性もある。
(後略)
データの書換可能な状態って「通常」の状態ですから、書換不可能な状態とはPDFのような状態を言っているのでしょうか。
それともCDRのWRITE-ONCEのような状態でしょうか。
原本との検証性を確保するのに、加工したデータでは加工した過程が明らかでないと出来ないことになりますから、加工過程などの情報も含めて保存出来るような環境で作業する必要がありますね。
プログラムであれば元のデータを再度プログラムで加工すれば同じデータになることが検証出来るでしょうけれど、数値以外の処理(図表処理など)による処理を行っていれば人間の判断など外部要素が出てきて再現性が低くなると思われます。
データの処理を仕事にしているなら、Rのようなデータ加工の過程を保存出来る言語環境とOpenCVのような標準的な画像処理環境を使って、「道具を揃えて」再現性を担保しておくことも考えておいた方が良いのかもしれません。
私も、自分でやったものと他の方がやったものが異なる場合があったりしますので、再現性の確保について普段から気を付けておくようにしようと思います。
それでは、今回はこのへんで。
0 件のコメント:
コメントを投稿