lcfOS: python/ppci/assembler.py annotate

annotate python/ppci/assembler.py @ 381:6df89163e114

Fix section and ldr pseudo instruction

author	Windel Bouwman
date	Sat, 26 Apr 2014 17:41:56 +0200
parents	19eacf4f7270
children	0c44e494ef58

rev	line source
334 6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	1
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	2 import re
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	3 import pyyacc
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	4 from . import Token, CompilerError, SourceLocation
342 86b02c98a717 Moved target directory Windel Bouwman parents: 341 diff changeset	5 from .target import Target, Label
334 6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	6
340 c7cc54c0dfdf Test featurebranch Windel Bouwman parents: 337 diff changeset	7
341 4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	8 def bit_type(value):
345 b4882ff0ed06 Added more arm isa tests Windel Bouwman parents: 342 diff changeset	9 assert value < (2**32)
341 4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	10 assert value >= 0
4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	11 t = 'val32'
345 b4882ff0ed06 Added more arm isa tests Windel Bouwman parents: 342 diff changeset	12 for n in [16, 12, 8, 5, 3]:
341 4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	13 if value < (2**n):
4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	14 t = 'val{}'.format(n)
4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	15 return t
4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	16
4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	17 def tokenize(s, kws):
334 6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	18 """
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	19 Tokenizer, generates an iterator that
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	20 returns tokens!
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	21
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	22 This GREAT example was taken from python re doc page!
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	23 """
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	24 tok_spec = [
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	25 ('REAL', r'\d+\.\d+'),
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	26 ('HEXNUMBER', r'0x[\da-fA-F]+'),
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	27 ('NUMBER', r'\d+'),
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	28 ('ID', r'[A-Za-z][A-Za-z\d_]*'),
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	29 ('SKIP', r'[ \t]'),
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	30 ('LEESTEKEN', r':=\|[\.,=:\-+*\[\]/\(\)]\|>=\|<=\|<>\|>\|<\|}\|{'),
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	31 ('STRING', r"'.*?'"),
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	32 ('COMMENT', r";.*")
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	33 ]
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	34 tok_re = '\|'.join('(?P<%s>%s)' % pair for pair in tok_spec)
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	35 gettok = re.compile(tok_re).match
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	36 line = 1
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	37 pos = line_start = 0
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	38 mo = gettok(s)
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	39 while mo is not None:
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	40 typ = mo.lastgroup
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	41 val = mo.group(typ)
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	42 if typ == 'NEWLINE':
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	43 line_start = pos
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	44 line += 1
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	45 elif typ != 'SKIP':
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	46 if typ == 'LEESTEKEN':
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	47 typ = val
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	48 elif typ == 'NUMBER':
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	49 val = int(val)
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	50 elif typ == 'HEXNUMBER':
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	51 val = int(val[2:], 16)
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	52 typ = 'NUMBER'
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	53 elif typ == 'REAL':
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	54 val = float(val)
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	55 elif typ == 'STRING':
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	56 val = val[1:-1]
341 4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	57 elif typ == 'ID':
4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	58 if val.lower() in kws: # ['r3', 'sp', 'add', 'yield', 'r4', 'r0', 'r1', 'sub', 'r5', 'r6', 'r2']:
4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	59 typ = val.lower()
334 6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	60 col = mo.start() - line_start
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	61 loc = SourceLocation('', line, col, 0) # TODO retrieve length?
341 4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	62 if typ == 'NUMBER':
4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	63 typ = bit_type(val)
334 6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	64 yield Token(typ, val, loc)
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	65 pos = mo.end()
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	66 mo = gettok(s, pos)
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	67 if pos != len(s):
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	68 col = pos - line_start
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	69 loc = SourceLocation('', line, col, 0)
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	70 raise CompilerError('Unexpected character {0}'.format(s[pos]), loc)
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	71 yield Token('EOF', pyyacc.EOF)
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	72
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	73
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	74 class Lexer:
341 4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	75 def __init__(self, src, kws):
4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	76 self.tokens = tokenize(src, kws)
334 6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	77 self.curTok = self.tokens.__next__()
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	78
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	79 def next_token(self):
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	80 t = self.curTok
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	81 if t.typ != 'EOF':
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	82 self.curTok = self.tokens.__next__()
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	83 return t
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	84
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	85
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	86 class Parser:
341 4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	87 def add_rule(self, prod, rhs, f):
4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	88 """ Helper function to add a rule, why this is required? """
4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	89 if prod == 'instruction':
4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	90 def f_wrap(*args):
4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	91 i = f(args)
381 6df89163e114 Fix section and ldr pseudo instruction Windel Bouwman parents: 375 diff changeset	92 if i:
6df89163e114 Fix section and ldr pseudo instruction Windel Bouwman parents: 375 diff changeset	93 self.emit(i)
341 4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	94 else:
4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	95 def f_wrap(*rhs):
4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	96 return f(rhs)
4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	97 self.g.add_production(prod, rhs, f_wrap)
4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	98
4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	99 def __init__(self, kws, instruction_rules, emit):
334 6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	100 # Construct a parser given a grammar:
375 19eacf4f7270 Started on memory manager Windel Bouwman parents: 346 diff changeset	101 tokens2 = ['ID', 'NUMBER', ',', '[', ']', ':', '+', '-', '*', '=',
341 4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	102 pyyacc.EPS, 'COMMENT', '{', '}',
345 b4882ff0ed06 Added more arm isa tests Windel Bouwman parents: 342 diff changeset	103 pyyacc.EOF, 'val32', 'val16', 'val12', 'val8', 'val5', 'val3']
341 4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	104 tokens2.extend(kws)
4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	105 self.kws = kws
4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	106 g = pyyacc.Grammar(tokens2)
4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	107 self.g = g
340 c7cc54c0dfdf Test featurebranch Windel Bouwman parents: 337 diff changeset	108 # Global structure of assembly line:
334 6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	109 g.add_production('asmline', ['asmline2'])
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	110 g.add_production('asmline', ['asmline2', 'COMMENT'])
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	111 g.add_production('asmline2', ['label', 'instruction'])
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	112 g.add_production('asmline2', ['instruction'])
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	113 g.add_production('asmline2', ['label'])
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	114 g.add_production('asmline2', [])
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	115 g.add_production('label', ['ID', ':'], self.p_label)
340 c7cc54c0dfdf Test featurebranch Windel Bouwman parents: 337 diff changeset	116
c7cc54c0dfdf Test featurebranch Windel Bouwman parents: 337 diff changeset	117 # Add instruction rules for the target in question:
c7cc54c0dfdf Test featurebranch Windel Bouwman parents: 337 diff changeset	118 for prod, rhs, f in instruction_rules:
341 4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	119 self.add_rule(prod, rhs, f)
340 c7cc54c0dfdf Test featurebranch Windel Bouwman parents: 337 diff changeset	120
334 6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	121 #g.add_production('instruction', [])
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	122 g.start_symbol = 'asmline'
341 4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	123 self.emit = emit
4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	124 self.p = g.generate_parser()
342 86b02c98a717 Moved target directory Windel Bouwman parents: 341 diff changeset	125 # print('length of table:', len(self.p.action_table))
334 6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	126
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	127 # Parser handlers:
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	128
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	129 def p_label(self, lname, cn):
341 4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	130 lab = Label(lname.val)
334 6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	131 self.emit(lab)
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	132
341 4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	133 def parse(self, lexer):
334 6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	134 self.p.parse(lexer)
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	135
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	136
381 6df89163e114 Fix section and ldr pseudo instruction Windel Bouwman parents: 375 diff changeset	137 class BaseAssembler:
6df89163e114 Fix section and ldr pseudo instruction Windel Bouwman parents: 375 diff changeset	138 """ Assembler base class, inherited by assemblers specific for a target """
346 3bb7dcfe5529 expanded arm target Windel Bouwman parents: 345 diff changeset	139 def __init__(self, target):
334 6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	140 self.target = target
340 c7cc54c0dfdf Test featurebranch Windel Bouwman parents: 337 diff changeset	141 assert isinstance(target, Target)
381 6df89163e114 Fix section and ldr pseudo instruction Windel Bouwman parents: 375 diff changeset	142
6df89163e114 Fix section and ldr pseudo instruction Windel Bouwman parents: 375 diff changeset	143 def make_parser(self):
6df89163e114 Fix section and ldr pseudo instruction Windel Bouwman parents: 375 diff changeset	144 self.parser = Parser(self.target.asm_keywords, self.target.assembler_rules, self.emit)
346 3bb7dcfe5529 expanded arm target Windel Bouwman parents: 345 diff changeset	145
3bb7dcfe5529 expanded arm target Windel Bouwman parents: 345 diff changeset	146 def emit(self, *args):
3bb7dcfe5529 expanded arm target Windel Bouwman parents: 345 diff changeset	147 self.stream.emit(*args)
334 6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	148
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	149 # Top level interface:
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	150 def parse_line(self, line):
340 c7cc54c0dfdf Test featurebranch Windel Bouwman parents: 337 diff changeset	151 """ Parse line into assembly instructions """
341 4d204f6f7d4e Rewrite of assembler parts Windel Bouwman parents: 340 diff changeset	152 tokens = Lexer(line, self.target.asm_keywords)
340 c7cc54c0dfdf Test featurebranch Windel Bouwman parents: 337 diff changeset	153 self.parser.parse(tokens)
334 6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	154
346 3bb7dcfe5529 expanded arm target Windel Bouwman parents: 345 diff changeset	155 def assemble(self, asmsrc, stream):
334 6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	156 """ Assemble this source snippet """
381 6df89163e114 Fix section and ldr pseudo instruction Windel Bouwman parents: 375 diff changeset	157 if type(asmsrc) is str:
6df89163e114 Fix section and ldr pseudo instruction Windel Bouwman parents: 375 diff changeset	158 pass
6df89163e114 Fix section and ldr pseudo instruction Windel Bouwman parents: 375 diff changeset	159 elif hasattr(asmsrc, 'read'):
334 6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	160 asmsrc2 = asmsrc.read()
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	161 asmsrc.close()
6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	162 asmsrc = asmsrc2
340 c7cc54c0dfdf Test featurebranch Windel Bouwman parents: 337 diff changeset	163 # TODO: use generic newline??
c7cc54c0dfdf Test featurebranch Windel Bouwman parents: 337 diff changeset	164 # TODO: the bothersome newline ...
346 3bb7dcfe5529 expanded arm target Windel Bouwman parents: 345 diff changeset	165 self.stream = stream
334 6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	166 for line in asmsrc.split('\n'):
340 c7cc54c0dfdf Test featurebranch Windel Bouwman parents: 337 diff changeset	167 self.parse_line(line)
334 6f4753202b9a Added more recipes Windel Bouwman parents: diff changeset	168
381 6df89163e114 Fix section and ldr pseudo instruction Windel Bouwman parents: 375 diff changeset	169 def flush(self):
6df89163e114 Fix section and ldr pseudo instruction Windel Bouwman parents: 375 diff changeset	170 pass

Mercurial > lcfOS

annotate python/ppci/assembler.py @ 381:6df89163e114