Python read file as hex

How to read binary files as hex in Python?

The simple solution that worked immediately, was to change «r» to «rb», so:

f=open('data.geno','r') # don't work f=open('data.geno','rb') # works fine 

The code in this case is actually only two binary bites, so one byte contains four data, binary; 00, 01, 10, 11.

If the file is encoded in hex format, shouldn’t each byte be represented by 2 characters? So

c=[] with open('data.geno','rb') as f: b = while b: c.append(b.decode('hex')) 

Just an additional note to these, make sure to add a break into your .read of the file or it will just keep going.

def HexView(): with open(, 'rb') as in_file: while True: hexdata = # I like to read 16 bytes in then new line it. if len(hexdata) == 0: # breaks loop once no more binary data is read break print(hexdata.upper()) # I also like it all in caps. 

import binascii # Open in binary mode (so you don't read two byte line endings on Windows as one byte) # and use with statement (always do this to avoid leaked file descriptors, unflushed files) with open('data.geno', 'rb') as f: # Slurp the whole file and efficiently convert it to hex all at once hexdata = binascii.hexlify( 

This just gets you a str of the hex values, but it does it much faster than what you’re trying to do. If you really want a bunch of length 2 strings of the hex for each byte, you can convert the result easily:

hexlist = map(''.join, zip(hexdata[::2], hexdata[1::2])) 

which will produce the list of len 2 str s corresponding to the hex encoding of each byte. To avoid temporary copies of hexdata , you can use a similar but slightly less intuitive approach that avoids slicing by using the same iterator twice with zip :

hexlist = map(''.join, zip(*[iter(hexdata)]*2)) 

For people on Python 3.5 and higher, bytes objects spawned a .hex() method, so no module is required to convert from raw binary data to ASCII hex. The block of code at the top can be simplified to just:

with open('data.geno', 'rb') as f: hexdata = 

#1 Дек. 20, 2011 19:26:49

Открыть файл в hex

Подскажите как открыть файл (.avi) в hex коде
Надо открыть файл видео в виде кода и парсить на нахождение одинаковых сочетаний кода..

#2 Дек. 20, 2011 20:43:33

Открыть файл в hex

#3 Дек. 20, 2011 21:33:26

Открыть файл в hex

bytelist = []

bytes = open('1.avi','rb')
filedata =

for byte in filedata:
print bytelist

#4 Дек. 20, 2011 21:50:37

Открыть файл в hex

.read — не самый лучший выбор для чтения больших файлов.
И я бы посоветовал использовать bytearray вместо обычного списка:

bytelist = bytearray()
with open('1.avi','rb') as bytes:
for byte in bytes:

#5 Дек. 20, 2011 22:10:56

Открыть файл в hex

#6 Дек. 20, 2011 23:12:06

Открыть файл в hex

зачем его вообще в память загружать ?

потому что файл загружается в память

если использовать .read(n), то можно пропустить подходящий фрагмент
например, поиск слова abcd может не сработать, когда
.read(n) -> aaaaaabc
.read(n) -> deeeeeeee
то есть нужный фрагмент есть, но он разделён между строками
(блочное чтение происходит быстрее, чем посимвольное)

используй конечный автомат, который при обнаружении начала переходит в состояние накапливания

Отредактировано (Дек. 20, 2011 23:12:18)

#7 Дек. 21, 2011 15:58:43

Открыть файл в hex

bytelist = []
f = open('1.txt', 'rb').read()
bytelist = [ ord(c) for c in f]

все нормально если файл небольшой.
Но при большом объеме тупо виснет, понимаю что идет в память .
Если объясню задачу может лучше будет:
надо в коде найти одинаковые сочетания,не заданные ,например(112), вырезать их поставив
типа маркера на место вырезанного кода,записать эти вырезанные участки например(112)-код,(4)-тип маркера, в списки, в конечном итоге вставить все на место из этих списков и все-на выходе получить тот же самый файл
Все это должно напоминать архиватор в некотором смысле

Читайте также:  Python app in xcode

#8 Дек. 22, 2011 19:36:24

Открыть файл в hex

Извиняюсь работает скрипт

bytelist = bytearray()
with open('01.mp3','rb') as bytes:
for byte in bytes:


#9 Дек. 22, 2011 20:21:37

Открыть файл в hex

скриптом выношу из бинарного во временной файл hex

bytelist = bytearray()
with open('01.mp3','rb') as bytes:
for byte in bytes:




подскажите алгоритм поиска одинаковых сочетаний(например пять единиц или семь F), потом надо вырезать это из кода,поставив допустим точку и цифру 1(типа метки),а сочетание вынести в начало временного файла ,(типа (.1)-это пять единиц)

#10 Дек. 22, 2011 20:50:52

Открыть файл в hex

может воспользоваться для записи количества повторений itertools.groupby ?
И кстати может не надо изобретать велосипеды вам просто RLE не подойдет?

Отредактировано (Дек. 22, 2011 20:52:47)


