Python3 だと sum 以外は高速に動くので sum だけ別に実装すればよい。 入力が多いので、入出力を高速に行う必要があることに注意されたし。

pypy