二项分布取max 就是交叉熵