本記事では、COIG-Writerという新しい中国語創造的ライティングデータセットを紹介しています。このデータセットは、創造的ライティングにおけるシステマティックな欠陥を補完することを目的としており、高品質なテキストの逆エンジニアリングによって多様な出力とその背後にある思考過程を捉えています。COIG-Writerは、1,665の精緻にキュレーションされたトリプレットを含み、各トリプレットは逆エンジニアリングされたプロンプト、詳細な創造的推論、最終的なテキストから構成されています。実験により、創造的ライティングはナarrative logicとlinguistic expressionという2つのコンポーネントで成り立ち、その効果的な利用には一般データとの安定化が必要であることが明らかになりました。また、創造的能力は文化に依存し、語彙の多様性は創造的な質とは逆相関関係にあることが示されました。これにより、創造的優秀性は論理的基盤と言語的根拠の相互作用によって生まれることが理解されます。